http://netstat.stat.tku.edu.tw
(User from: 54.224.202.184)
機率  |  統計  |  Data Mining  |  資料處理  |  DEMO  |  Data  |  Links  |  Books  |  相關文件  |   ( ENGLISH )

Home

機率
 計算/查表
 隨機亂數
 Density plots
統計
 基本統計
 卡方檢定
 迴歸分析
 ANOVA
 時間數列
 多變量分析
 品質管制
 無母數方法
Data Mining
 決策樹
 Logistic
 判別分析
 集群分析
 類神經網路
 關聯規則分析
 ALL Methods

 
共整合檢定 (Co-Integration Test) : 選擇資料來源
 
 
  • 使用 User Data : 您目前沒有資料檔 (建立資料檔)

  • 使用 Sample Data ==> 請從下列表格選擇 Sample Data

Sample Data (括號中為觀察值數目)
 
[一般資料]
blood (16) brain (37) crime (51) emissions (26)
florida (67) homedata (6841) movies (25)  
 
[ 類別資料 ]
babies (1155) bumpers (23) cancer (62) carbon (24=3x8)
chicken (39 = 3 x 13) crab (362) hiv (2144) video (91)
 
 
[ 資料探勘 ]
beer (5) bloodtw (748) boston (350) car (406)
iris (150) lung (228)  
 
[ 時間數列 ]
TS3a (97) cpi (240) dow (443) fraser (946)
ind (240) ind2 (240) lynx (64) man (240)
nino (598) ozone (216)
[ 一般數值資料 ] blood , 變數數目: 2, 觀察值數目: 16

分別由機器與專家測量的血壓值

  • (C1) Machine : 機器測量值
  • (C2) Expert : 專家測量值
(查看 data)
=> 分析 blood
[ 一般數值資料 ] brain , 變數數目: 7, 觀察值數目: 37

37 個人的腦容量測量值與其他資料

  • (C1) Gender : 性別
  • (C2) FSIQ : FSIQ 指標
  • (C3) VIQ : VIQ 指標
  • (C4) PIQ : PIQ 指標
  • (C5) Weight : 體重
  • (C6) Height : 身高
  • (C7) BrainSize : 腦容量測量值
(查看 data)
=> 分析 brain
[ 一般數值資料 ] crime , 變數數目: 3, 觀察值數目: 51

美國 51 個州分別在 1983 與 1993 的暴力犯罪數字

  • (C1) y1983 : 1983 年數據
  • (C2) y1993 : 1993 年數據
(查看 data)
=> 分析 crime
[ 一般數值資料 ] emissions , 變數數目: 3, 觀察值數目: 26

26 個國家的二氧化碳排放數據與經濟指標 (1999)

  • (C1) GDP
  • (C2) perCapita
  • (C3) CO2 : 二氧化碳排放量
(查看 data)
=> 分析 emissions
[ 一般數值資料 ] florida , 變數數目: 12, 觀察值數目: 67

2000 年美國總統大選佛羅里達州 67 個郡 (county) 的投票資料

  • (C1) County : 郡名
  • (C2) GORE
  • (C3) BUSH
  • (C4) BUCHANAN
  • (C5) NADER
  • (C6) BROWNE
  • (C7) HAGELIN
  • (C8) HARRIS
  • (C9) MCREYNOLDS
  • (C10) MOOREHEAD
  • (C11) PHILLIPS
  • (C12) Total : 總票數
(查看 data)
=> 分析 florida
[ 一般數值資料 ] homedata , 變數數目: 2, 觀察值數目: 6841

紐澤西 Maplewood 地區 6841 件房地產在 1970 與 2000 年的估價

  • (C1) y1970 : 1970 年的價格
  • (C2) y2000 : 2000 年的價格
(查看 data)
=> 分析 homedata
[ 一般數值資料 ] movies , 變數數目: 4, 觀察值數目: 25

美國在 2001 年 6 月賣座最佳的 25 部電影資料.單位:百萬美金
(http://www.movieweb.com/movie/top25.html)

  • (C1) title : 片名
  • (C2) current : 當週紀錄
  • (C3) previous : 前週紀錄
  • (C4) gross : 累積金額
(查看 data)
=> 分析 movies
[ 類別資料 ] babies , 變數數目: 7, 觀察值數目: 1155

初生嬰兒與母親的資料

  • (C1) bwt : 出生時的體重 (ounces)
  • (C2) gestation : 懷孕總日數
  • (C3) parity : 胎序,0= 第一個小孩, 9=unknown
  • (C4) age : 母親年齡
  • (C5) height : 母親身高 (inches)
  • (C6) weight : 母親在懷孕前的體重 (pounds)
  • (C7) smoke : 母親是否抽煙. 0:沒有, 1:有
(查看 data)
=> 分析 babies
[ 類別資料 ] bumpers , 變數數目: 2, 觀察值數目: 23

23 款汽車保險桿 (bumpers) 的修理次數

  • (C1) Car : 汽車品牌
  • (C2) repair : 維修次數
(查看 data)
=> 分析 bumpers
[ 類別資料 ] cancer , 變數數目: 5, 觀察值數目: 12,16,17,6,11

不同類的癌症病患存活時間

  • (C1) stomach : 胃癌
  • (C2) bronchus : 支氣管癌
  • (C3) colon : 結腸癌
  • (C4) ovary : 卵巢癌
  • (C5) breast : 乳癌
(查看 data)
=> 分析 cancer
[ 類別資料 ] carbon , 變數數目: 2, 觀察值數目: 24=3x8

三個不同地區的一氧化碳測量值

  • (C1) Monoxide : 一氧化碳含量
  • (C2) Site : 區域編號: 1,2,3
(查看 data)
=> 分析 carbon
[ 類別資料 ] chicken , 變數數目: 3, 觀察值數目: 39 = 3 x 13

肉雞在三種不同飼料下的體重增加值

  • (C1) Ration1 : 飼料1
  • (C2) Ration2 : 飼料2
  • (C3) Ration3 : 飼料3
(查看 data)
=> 分析 chicken
[ 類別資料 ] crab , 變數數目: 2, 觀察值數目: 362

362 隻螃蟹的資料

  • (C1) size : 甲殼尺寸
  • (C2) shell : 外殼狀況, 1:乾淨, 2:骯髒
(查看 data)
=> 分析 crab
[ 類別資料 ] hiv , 變數數目: 6, 觀察值數目: 2144

血友病患者的 HIV 感染資料
(http://www.stat.Berkeley.EDU/users/statlabs/labs.html)

  • (C1) hiv : HIV status 1= negative, 2=positive
  • (C2) factor : Factor 8 平均劑量,1=high, 2=moderate,
    3=low, 4=unknown, 5=none
  • (C3) year : 年
  • (C4) age : 年齡群組,每 5 年為 1 組: 1=0-4, 2=5-9, ..., 13=60-64, 14=65+
  • (C5) py : Person years
  • (C6) deaths : Number of deaths
(查看 data)
=> 分析 hiv
[ 類別資料 ] video , 變數數目: 15, 觀察值數目: 91

調查青少年關於電玩的問卷

  • (C1) time : 每週花在電玩的時數
  • (C2) like : 電玩喜好程度:1=Never played, 2=Very much, 3=Somewhat,
    4=Not really, 5=Not at all
  • (C3) where : 1=Arcade, 2=Home on a system, 3=Home on a computer
    4=Home on computer and system, 5=Arcade and Home(system or computer)
    6=Arcade and home (both system and computer)
  • (C4) freq : 玩電玩的頻率,1=Daily, 2=Weekly, 3=Monthly, 4=Semesterly
  • (C5) busy : 就算很忙的時候也照玩:0=no, 1=yes
  • (C6) educ : 是否認為電玩有益學習:0=no, 1=yes
  • (C7) sex : 性別:0=女,1=男
  • (C8) age : 年齡
  • (C9) home : 家中是否有電腦? 0=No,1=Yes
  • (C10) math : 是否討厭數學? 0=No,1=Yes
  • (C11) work : 每週工作時數
  • (C12) own : 自己是否有 PC? 0=No,1=Yes
  • (C13) cdrom : 自己的 PC 是否有 CDROM? 0=No,1=Yes
  • (C14) email : 擁有 email 帳號? 0=No,1=Yes
  • (C15) grade : 預期的學業成績:4=A, 3=B, 2=C, 1=D, 0=F
(查看 data)
=> 分析 video
[ 資料探勘 ] beer , 變數數目: 6, 觀察值數目: 5

關聯規則資料: Beer and Diaper
每一列為 0 或 1 的 transaction 紀錄

  • (C1) Bread : 麵包
  • (C2) Milk : 牛奶
  • (C3) Diaper : 尿布
  • (C4) Beer : 啤酒
  • (C5) Egg : 蛋
  • (C6) Coke : 可樂
(查看 data)
=> 分析 beer
[ 資料探勘 ] bloodtw , 變數數目: 5, 觀察值數目: 748

台灣新竹捐血資料 (source: Prof. I-Cheng Yeh, 中華大學資管系)

  • (C1) Recency : 距離上次捐血的時間(月)
  • (C2) Frequency : 累積捐血次數
  • (C3) Monetary : 累積捐血量
  • (C4) Time : 距離第一次捐血的時間(月)
  • (C5) March2007 : 1 or 0, 是否在 2007 年三月捐血
(查看 data)
=> 分析 bloodtw
[ 資料探勘 ] boston , 變數數目: 13, 觀察值數目: 350

Boston 住宅區資料

  • (C1) Crime : 犯罪率
  • (C2) Lots : 大型公共區域比例
  • (C3) Industry : 工業比例
  • (C4) CHAS : Charles River dummy variable
  • (C5) NO : 空氣中的一氧化氮比例(ppm)
  • (C6) Rooms : 平均每戶的房間數目
  • (C7) Owner : 1940 年之前所建的自宅比例
  • (C8) WorkDistance : 距離上班商業中心地點的英哩數
  • (C9) HwyDistance : 距離主要高速公路網路的英哩數
  • (C10) Tax : 房屋與土地相關的 Tax 比例
  • (C11) Teacher : 平均 學生 vs. 教師比例
  • (C12) Racial : 與種族有關的數據
  • (C13) LowIncome : 低收入戶比例
  • (C14) Class : 住宅區評價:Top 20% 或 Bottom 80%
(查看 data)
=> 分析 boston
[ 資料探勘 ] car , 變數數目: 9, 觀察值數目: 406

406 輛汽車的資料 (1993)

  • (C1) Country : 區域類別(是否美國生產)
  • (C2) Mpg : Miles per gallon(每加侖可跑哩數)
  • (C3) Cylinder : 汽缸數目
  • (C4) Displacement : 排氣量
  • (C5) HorsePower : 馬力
  • (C6) Weight : 重量
  • (C7) Acceleration : 加速至車速 60 miles 的秒數
  • (C8) Year : 車齡
  • (C9) Origin : 生產區域代號(1:US,2:Europe,3:Japan)
(查看 data)
=> 分析 car
[ 資料探勘 ] iris , 變數數目: 5, 觀察值數目: 150

資料探勘: iris data

  • (C1) SepalLength : 花萼長度
  • (C2) SepalWidth : 花萼寬度
  • (C3) PetalLength : 花瓣長度
  • (C4) PetalWidth : 花瓣寬度
  • (C5) Species : 種類
(查看 data)
=> 分析 iris
[ 資料探勘 ] lung , 變數數目: 10, 觀察值數目: 228

Mayo Clinic 肺癌病人資料

  • (C1) inst : 醫療機構的編號
  • (C2) time : 存活時間 (days)
  • (C3) status : 狀態. 1=censored, 2=dead
  • (C4) age : 年齡
  • (C5) sex : 性別
  • (C6) ph.ecog : ECOG 分數 (0 = good ~ 5 = dead )
  • (C7) ph.karno : Karnofsky 分數,由醫生判斷 (0 = bad ~ 100 = good)
  • (C8) pat.karno : Karnofsky 分數, 病人自行判斷
  • (C9) meal.cal : 用餐的卡路里含量
  • (C10) wt.loss : 過去六個月的體重減輕量(負數表示體重增加)
(查看 data)
=> 分析 lung
[ 時間數列 ] TS3a , 變數數目: 25, 觀察值數目: 97

台灣股價指數與個別產業指數 (2001/12 到 2002/4)

  • (C1) Date : 民國年份
  • (C2) TWindex : 台灣加權指數
  • (C3) Number : 成交股數
  • (C4) Cement : 水泥類股
  • (C5) Foods : 食品類股
  • (C6) Plastics : 塑膠類股
  • (C7) Textiles : 紡織纖維類股
  • (C8) ElecMach : 電機機械類股
  • (C9) ElecAppl : 電器電纜類股
  • (C10) Chemicals : 化學類股
  • (C11) Glass : 玻璃陶瓷類股
  • (C12) Paper : 造紙類股
  • (C13) Steel : 鋼鐵類股
  • (C14) Rubber : 橡膠類股
  • (C15) Car : 汽車類股
  • (C16) Electron : 電子股
  • (C17) Construction : 營造類股
  • (C18) Transport : 運輸類股
  • (C19) Tourism : 觀光類股
  • (C20) Finance : 金融保險類股
  • (C21) Wholesale : 百貨貿易類股
  • (C22) Others : 其他類股
  • (C23) Cement : 水泥窯製類股
  • (C24) Plastics : 塑膠化工類股
  • (C25) Electr : 機電類股
(查看 data)
=> 分析 TS3a
[ 時間數列 ] cpi , 變數數目: 3, 觀察值數目: 240

台灣消費者物價指數資料, 1982 1 月到 2001 年 12 月

  • (C1) time : 西元年月
  • (C2) CPI : 消費者物價指數
  • (C3) whole.sale : 躉售物價指數
(查看 data)
=> 分析 cpi
[ 時間數列 ] dow , 變數數目: 5, 觀察值數目: 443

美國道瓊指數從 1991 1 月到 2000 年 10 月數據

  • (C1) Date : 年月
  • (C2) Open : 當日開市指標
  • (C3) High : 當日最高指數
  • (C4) Low : 當日最低指數
  • (C5) Close : 當日閉市指數
(查看 data)
=> 分析 dow
[ 時間數列 ] fraser , 變數數目: 1, 觀察值數目: 946

Fraser River at Hope, 每月平均水流量 (CMS),1912.3-1991.12

  • (C1) fraser : CMS 測量值
(查看 data)
=> 分析 fraser
[ 時間數列 ] ind , 變數數目: 6, 觀察值數目: 240

台灣工業指數資料 (1), 1982 1 月到 2001 年 12 月

  • (C1) time : 西元年月
  • (C2) total : 總指數
  • (C3) food : 食品業
  • (C4) can : 罐頭食品業
  • (C5) beer : 啤酒業
  • (C6) drink : 不含酒精飲料業
(查看 data)
=> 分析 ind
[ 時間數列 ] ind2 , 變數數目: 6, 觀察值數目: 240

台灣工業指數資料 (2), 1982 1 月到 2001 年 12 月

  • (C1) time : 西元年月
  • (C2) car : 汽車業
  • (C3) autobike : 機車業
  • (C4) toy : 玩具業
  • (C5) power : 電力供應業
  • (C6) gas : 氣體燃料供應業
(查看 data)
=> 分析 ind2
[ 時間數列 ] lynx , 變數數目: 3, 觀察值數目: 64

加拿大北部 McKenzie River 區的山貓 (lynx)
與 貂 (mink) 的年度補抓數量 (1848 到 1911)

  • (C1) Year : 西元年份
  • (C2) Lynx : 被補抓的山貓數量
  • (C3) Mink : 被補抓的貂數量
(查看 data)
=> 分析 lynx
[ 時間數列 ] man , 變數數目: 5, 觀察值數目: 240

台灣勞動力數據, 1982 1 月到 2001 年 12 月

  • (C1) time : 西元年月
  • (C2) population : 總人口數
  • (C3) labor : 勞動力
  • (C4) employed : 就業勞動力
  • (C5) unemployed : 失業勞動力
(查看 data)
=> 分析 man
[ 時間數列 ] nino , 變數數目: 2, 觀察值數目: 598

海洋表面溫度. Nino 3 and Nino 3.4 指標 (1950.1 到 1999.10)

  • (C1) Nino3
  • (C2) Nino3.4
(查看 data)
=> 分析 nino
[ 時間數列 ] ozone , 變數數目: 1, 觀察值數目: 216

Ozone concentration (臭氧濃度) , downtown L.A. 1955.1-1972.12

  • (C1) ozone : 臭氧濃度
(查看 data)
=> 分析 ozone