確率統計(2009年度第1講) - 法政大学 [hosei...

59
確率統計(2009年度第1講) 応用情報工学科 八名和夫

Upload: others

Post on 25-Mar-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

確率統計(2009年度第1講)

応用情報工学科 八名和夫

講義概要

応用情報分野で用いる確率論の基礎事項について講義

データ処理に重要な統計的検定 データ処理に重要な統計的検定

選択科目(教職を目指す諸君は必修)

教科書(参考書)

P. Z. Peebles, Jr., Probability, Random Variables, and Random Signal PrinciplesRandom Signal Principles,4th Edition, McGraw Hill, ISBN:0071181814

amazon.co.jpでペーパーバック版

6,648円

PZ ピーブルズ著、平野信夫訳、

電子・通信工学のための確率論序説

電機大出版局

応用情報工学の分野と確率論

情報ネットワーク分野

情報処理分野 情報処理分野

計算機工学分野

情報デバイス分野

Map of Major Interregional Internet Routes larger than 5Gbps, 2004

インターネット通信

p j g g p

Source: http://www.telegeography.com/ee/free_resources/gig2005-03.php

Science Information Network (SINET) has direct connection to the U K (150Mbps) and theScience Information Network (SINET) has direct connection to the U.K. (150Mbps) and the U.S.A. (10Gbps) as of January,

ブロードバンド通信帯域 Broad band infrastructure (Interregional Internet Bandwidth, 2004)

Source: http://www.telegeography.com/ee/free_resources/gig2005-02.php

Packet Round Trip Time from Tokyo

> ping www.waseda.ac.jp

Reply from 133.9.19.105: bytes=32 time=7ms Reply from 133.9.19.105: bytes=32 time=6ms To Waseda Universityp y yReply from 133.9.19.105: bytes=32 time=6ms

> ping www.stanford.edu

To Waseda University

Reply from 171.64.10.77: bytes=32 time=132ms Reply from 171.64.10.77: bytes=32 time=131ms Reply from 171.64.10.77: bytes=32 time=132ms

To Stanford University

> ping www.mit.edu

Reply from 18.7.22.83: bytes=32 time=188msReply from 18 7 22 83: bytes=32 time=188ms T MIT i LAReply from 18.7.22.83: bytes=32 time=188msReply from 18.7.22.83: bytes=32 time=187msReply from 18.7.22.83: bytes=32 time=187ms

> i k

To MIT via LA

> ping www.cam.ac.uk

Reply from 131.111.8.46: bytes=32 time=266msReply from 131.111.8.46: bytes=32 time=266ms To Cambridge Univ. via USAReply from 131.111.8.46: bytes=32 time=266ms

Internet Backbone Traffic in JapanSource: http://www.jpix.co.jp/jp/techncal/traffic.html

IX (Internet Exchange) topology in Japan

Internet Backbone Traffic in LondonSource: http://www2.linx.net/tools/stats/index.thtml

G IX t ffi O t 30 2005Germany IX traffic Oct. 30, 2005Deutscher Commercial Internet Exchange

Paris IX traffic Oct. 30, 2005

Source: http://www.euro-ix.net/isp/choosing/search/traffic.shtml

The number of host computers connected to the Internet

World population 6.15 billion= 2 32.5 as of Jan 2001

32

(4.3billion)

110 million

14 million

TimeSource http://www.isc.org/index.pl?/ops/ds/

太平洋を越えたインターネット・リアルタイム講義の実践:

講師側(米国): 遠隔サイトの学生を見ながら講義を行う

受講者側(日本): 学生は講師の姿・音声とパワーポイント資料・手書き文字を視聴

遠 講義 構成遠隔講義システム構成図IT研究センター遠隔講義室: 法政大学アメリカ研究所/UC-Davis

カメラ2カメラ1 プレゼンテーション同期講師

Digital Display

H323端末

ビデオ・

Camera

ディスプレイ

H323端末

実時間コンテンツア カイブ

受講者

ビデオオーディオ

リンク

H323端末

コンテンツアーカイブ

教育支援システムドットキャンパス

CD コンテンツ

ビデオ・パワーポイント再生 音声

ドットキャンパスSakaiメーリングリスト

イント再生・音声サーチ機能

e-Class Exchangeグローバル展開へ向けて

Denver

リアルタイム講義の共通時間窓

4 pm 6 pmTokyo HawaiiNY

9 am 2 pm 5 pm 7 pmSF

ChicagoChicago

Tokyo5 pm

India

12 pm

Germany

9 am

6 pm

5 pm

12:30pm

p

10 am

Beijing

p

MoscowEngland time

ネットワークトラフィック

応用情報工学分野と確率論

通信工学分野

情報処理分野 情報処理分野

計算機工学分野

電子デバイス分野

確率論はなにに使えるか?

信号処理

信号の予測 雑音除去 エ キ ンセル 信 信号の予測、雑音除去、エコーキャンセル、信号検出、パターン認識など

エコーキャンセル

( )xe1)(

適応フィルタ

x1(n) xx eexF

11)(

y(n) x2(n)e(n) ) x2(n)e(n)

x1:男性の音声 x2:女性の音声

通信分野

最適受信機、光通信、ネットワーク評価通信路雑音レベルの評価、モバイル基地局設置計画通信路雑音レベルの評価、モバイル基地局設置計画

計測分野

センサ の雑音センサーの雑音

計算機分野

ヒ ト率の高いキ シ の設計ヒット率の高いキャッシュの設計

ランダム実験の例ランダム実験の例

一般

サイコロ投げ・コイン投げ・トランプを一枚引く・ビュフォンの針・ある日ある時刻における天気・出産

応 情報 学分野応用情報工学分野

雑音を含む伝送路を伝わってくる情報の受信・手書き文字認識 雑音を含む計測 メ タを読 取る カウの認識・雑音を含む計測・ メータを読み取る フォトンカウン

ティング

課題1:身近なランダム実験の例と応用情報工学分野におけるラン身近なランダム実験の例と応用情報工学分野におけるランダム実験にどんなものがあるか少なくとも一つ挙げてみよう。

hh

d

d/h=0.8

試行回数(1)300回

試行回数(2)1000回試行回数(2)1000回

交わる確率 2d/πh

http://www.angelfire.com/wa/hurben/buff html で実験ができる

図は小林道正,Mathematica 確率,

/buff.html で実験ができる。

図 小林道 , 確率,朝倉書店,2000より引用

ビュフォンGeorge-Louis Leclerc de Buffon 1707-1788George Louis Leclerc de Buffon 1707 1788

フランスの博物学者・啓蒙思想家 ニュ トンの著作思想家。ニュートンの著作を翻訳しフランスに紹介。その著「博物誌」は自然にその著「博物誌」は自然に関する知の総合として全ヨーロッパで広く読まれた。ッ 広く読まれた。(大辞林第二版)

20歳で二項定理を発見歳 項定 発見

ビュフォンの針の実験

(1777発表)(1777発表)

写真:http://www-groups.dcs.st-and.ac.uk/~history/Mathematicians/Buffon.html

男子出生率は年により変化する変化する

小林道正 Mathematica 確率 朝倉小林道正,Mathematica 確率,朝倉書店,2000より引用

フォトンカウンティング

放射線(X線、γ線など)

シンチレータ 光電変換

電圧パルス光

時間時間

統計学の考え方統計学の考え方A大学へのRTT B大学へのRTT

21.56

23.5446.23

64 3454.66

34.54

64.34

33.45

37 86.

.

37.86

.

.32.65 47.43

RTTの計測値は一回毎に異なる。 この値を決定しようとすることはナンセンスであRTTの計測値は 回毎に異なる。 この値を決定しようとすることはナンセンスである。 むしろRTTの代表的な値と分布のようすを捕らえることが重要である。 また、これらの数値の集まりからB大学へのRTT値はA大学へのRTT値より大きいという結

論を得ることができるであろうか? このような問いに対して統計学により合理的な論を得ることができるであろうか? このような問いに対して統計学により合理的な判断を提供する。

統計学の内容統計学の内容 Descriptive Statistics(記述統計) Probability(確率) Discrete Random Variables (離散確率変数) Continuous Random Variables (連続確率変数)(連続確率変数) Sampling Distribution (標本分布) Confidence Intervals(信頼区間) Hypothesis Testing (仮説検定) Hypothesis Testing (仮説検定) Statistical Inference(統計的推測) Experimental Design and Analysis of Variance(実験計画と分散分析)

Linear Regression Analysis(線形回帰分析) Linear Regression Analysis(線形回帰分析) Multiple Regression(多重回帰) Statistical Model Building (統計的モデルの構成)

Ti S i F ti (時系列予測) Time Series Forecasting (時系列予測) Decision Theory (決定理論)

統計学 Statistics

データを収集、整理、提示、解析する科学的な方法を提供。これらの手法を元に妥当な結論を導き、合理的な決定を行う手法を提供するう手法を提供する。

統計 Statistics統計

観測・測定データあるいは観測・測定データの集まり。

データから計算される数値(例えば平均値)。

Descriptive Statistics(記述統計)p

母集団あるいは標本に関する重要な性質を記述する手法

データ分布 デ タ分布

Stem-and-leaf display(幹葉表現)

ヒストグラム ヒストグラム

傾向指標

平均 M メジアン di モ ド d 平均:Mean, メジアン:median, モード:mode

Data example: auto fuel economy

1 インサイト (ホンダ MT) 60 9(miles/gallon) 25 9(km/l)1. インサイト (ホンダ MT) 60.9(miles/gallon) 25.9(km/l)2. インサイト (ホンダ AT) 56.9(miles/gallon) 24.2(km/l)3. プリウス (トヨタ AT) 52.0(miles/gallon) 22.1(km/l)4. シビック (ホンダ AT) 47.8 (miles/gallon) 20.4(km/l)( ) ( g ) ( )5. シビック (ホンダ MT) 46.1(miles/gallon) 19.6(km/l)6. ジェッタ・ワゴン (VW MT) 42.1(miles/gallon) 17.9(km/l)7. 新型ビートル ゴルフ ジェッタ

(VW MT) 42 1(miles/gallon) 17 9(km/l)(VW MT) 42.1(miles/gallon) 17.9(km/l)8. エコー (トヨタ MT) 35.1(miles/gallon) 14.9(km/l)9. ゴルフ ジェッタ ジェッタ・ワゴン

(VW AT) 34.1(miles/gallon) 14.5(km/l)10.新型ビートル (VW AT) 34.1(miles/gallon) 14.5(km/l)

6位と7位、9位と10位の差は高速走行時の燃費による

Stem-and-leaf display(幹葉表現)

Data example 2: Payment timesp y

Data example 2: Payment times

Stem-and-leaf display(幹葉表現)(幹葉表現)

Skewed with a tail to the right

Data example3: The marketingData example3: The marketing Research Case:

Stem-and-leaf display(幹葉表現)(幹葉表現)

ヒストグラムヒストグラム

Population parameterp p

Th l tiThe population mean Population of profit margins for five of the best companies in the

Population of profit margins for five of the best companies in the computer industry

Source: January 10,2000 issue of Forbes magazineSource: January 10,2000 issue of Forbes magazine

Sample mean x The average of the sample measurements Sample size n: the number of sample Sample size n: the number of sample

measurements

標本平均: 燃費の例

Median(中央値)Median(中央値)

Median(中央値)C t ti f ti ti

dM(Customer satisfaction ratings

最頻値:Mode oM

平均値、中央値、最頻値の比較

Measures of Variation

Range: The largest measurement minus the smallest measurementthe smallest measurement

Range: 5 - 3=2(days) Range: 7 - 1=6(days)

Variance and Standard Deviation(分散と標準偏差)

Variance and Standard DeviationVariance and Standard Deviation(分散と標準偏差)(

Variance and Standard Deviation(分散と標準偏差)

Tolerance interval(許容区間)(許容区間)

パーセント点,4分位数

Percentile: For a set of measurements arranged in increasing

order, the pth percentile is a value such that p, p p ppercent of the measurements fall at or below the value, and (100-p) percent if the measurements f ll b h lfall at or above the value.

Quartile:Q The first quartile Q1: 25th percentile The second quartile (median)Md: 50th percentile The second quartile (median)Md: 50 percentile The third quartile, Q3: 75th percentile

箱ひげ図:Box-and-Whiskers Displayp y

Box-and-Whiskers Display

Bar Chart and Pie Chart

Scatter Plot(散布図)(

まとめ

確率統計は応用情報工学の全ての分野で重要な基礎科目である。

応用情報工学への応用を念頭に確率・統計の基本的な考え方 応用を学ぶ的な考え方、応用を学ぶ。

質問は [email protected]までy jp