計量經濟學與統計軟件
論壇 计量经济学与统计論壇 五区 計量經濟學與統計軟件
資料狂人
4813 69
2018-06-29

R是一套完整的數據處理、計算和制圖軟件系統。

其功能包括:

1.  數據存儲和處理系統;

2.  數組運算工具(其向量、矩陣運算方面功能尤其強大);

3.  完整連貫的統計分析工具;

4.  優秀的統計制圖功能;

5.  簡便而強大的編程語言:可操縱數據的輸入和輸出,可實現分支、循環,用戶可自定義功能。


與其說R是一種統計軟件,還不如說R是一種數學計算的環境,因爲R並不是僅僅提供若幹統計程序、使用者只需指定數據庫和若幹參數便可進行一個統計分析。

R的思想是:它可以提供一些集成的統計工具,但更大量的是它提供各種數學計算、統計計算的函數,從而使使用者能靈活機動的進行數據分析,甚至創造出符合需要的新的統計計算方法


7月22-26日“R數據挖掘與機器學習”集中短訓現場班

通過案例掌握R初高級_每講均配有案例幫助迅速掌握應用

講師介紹:

方匡南現爲廈門大學經濟學院統計系教授、博士生導師、耶魯大學博士後,廈門大學數據挖掘研究中心副主任,國際統計學會會士,兩岸關系和平發展協同創新中心研究員、全國工業統計學會理事、廈門統計學會常務理事。

主要究方向爲數據挖掘、機器學習、應用統計、大數據風險管理及健康醫療大數據。

曾先后发表论文70多篇,其中在 JMVA、Nature子刊 Scientific Reports、CSDA、Annals of Operation Research、Biometrical Journal等国际权威期刊发表30多篇,在《管理科学学报》、《经济研究》、《统计研究》、《数量经济技术经济研究》等国内权威期刊发表40多篇。先后主持了国家自然科学基金面上项目、青年项目、国家社科基金重大项目子课题、国家统计局重大项目等学术纵向课题10多项。

有較豐富的數據挖掘實踐經驗,先後承擔了華爲、南方電網、華星光電、建行等30多項企業和政府數據挖掘項目,項目內容涉及互聯網金融的大數據征信、智能制造中的數據挖掘、輿情分析與文本挖掘、深度學習與圖像處理、景氣指數預測預警等。


學員對象:

金融、醫療、通訊、咨詢、電子商務等領域的數據分析人員、數據挖掘工程師、數據科學家;

高校碩士生、博士生、青年教師等。


開課信息:

時間:

初級:2019年7月22-24日(三天)

高級:2019年7月24-26日(三天)

全程:2019年7月22-26日 (五天)

地點:北京市海澱區廠窪街3號丹龍大廈附近

費用:

初级:3300元/ 2800元(本科及硕士在读优惠价)

高级:3600元/ 3100元(本科及硕士在读优惠价)

全程:6000元/ 5400元(本科及硕士在读优惠价)

(食宿自理)

安排:上午9:00-12:00;下午2:00-5:00;答疑

初級班報名

高級班報名

全程班報名


培訓目的和特色:

1. 讓學員快速入門並熟練掌握R語言,掌握如何利用R豐富的網上資料和幫助系統,學會基本的編程方法。
2. 以實際案例引入,深入淺出地講解如何使用R語言進行數據挖掘和機器學習,讓學員不僅掌握R語言的使用,更重要的是學會數據挖掘和機器學習的思想、原理和方法。
3. 学完本课程后,使学员基本上可以使用R语言进行实际的数据挖掘工作。尤其學會使用R語言對批量處理的實務數據分析,大大提高工作效率。


培訓內容目錄:

【初級班】

專題名稱

授課內容

第1講(3小時)

R語言入門


目標:掌握R語言的基本用法

1.R語言介紹

2.編輯軟件Rstudio使用

3.R程序包的載入與使用

4.數據對象及運算(向量、矩陣、數組、列表與數據框處理)


2(3小時)

數據讀寫

R基本編程


目標:掌握用R編寫函數和數據的讀寫

1. R数据读入与读出

    (读入txt、xls、SPSS、SAS、stata以及数据库文件)

2.R 函数编写

3.R的條件與循環函數

4.高效編程技巧介紹


3(3小時)

數據預處理

探索性分析


目標:掌握數據預處理与探索性分析

1.數據預處理

2.缺失值處理

3.隨機數生成

4.常用統計方法的蒙特卡洛模擬

5.隨機抽樣

6.單變量數據分析與作圖

7.雙變量數據分析與作圖

8.多變量數據分析與作圖

案例1:統計作圖在調查數據中的應用

案例2:統計作圖在臨床醫學中的應用


43小時)

數據挖掘與機器學習入門

線性回歸


目標:數據挖掘與機器學習入門

1.何爲數據挖掘與機器學習

2.數據挖掘與機器學習的主要研究內容

3.有監督學習與無監督學習區別

4.一元線性回歸

5.多元線性回歸

6.逐步回歸

案例1:廣告營銷計劃案例

案例2:信用卡債務預測案例

案例3:房價預測案例


5(3小時)

線性分類方法


目標:掌握经典線性分類方法及其应用

1.Logistic模型

2.LDA判別分類

3.QDA判別分類

案例1:信用卡違約預測案例

案例2:股價漲跌方向預測案例

第6講(3小時)

重抽樣方法

互動交流討論


目標:掌握经典重抽樣方法

1.驗證集方法

2.交叉驗證

3.Bootstrap方法

案例1:量化投資資産配置案例

案例2:汽車每加侖汽油裏程數預測案例

互動交流討論


【高級班】

專題名稱

授課內容


1

線性分類方法


目標:掌握经典線性分類方法及其应用

1.Logistic模型

2.LDA判別分類

3.QDA判別分類

案例1:信用卡違約預測案例

案例2:股價漲跌方向預測案例


2(3小時)

重抽樣方法


目標:掌握经典重抽樣方法

1.驗證集方法

2.交叉驗證

3.Bootstrap方法

案例1:量化投資資産配置案例

案例2:汽車每加侖汽油裏程數預測案例


3(3小時)

決策樹

組合預測


课程目標:掌握決策樹和組合預測方法及其实际应用。

1.CART決策樹

2.Bagging

3.随机森林   

4.Boosting算法

案例1:棒球運動員薪水預測案例

案例2:心髒病預測案例

案例3:信用卡違約預測案例


4(3小時)

支持向量機


课程目標:掌握支持向量機分类方法

1.間隔分類器

2.支持向量分類器

3.支持向量機

案例1:基因表達數據案例

案例2:股票漲跌方向預測


5(3小時)

變量選擇與高維數據


目標:掌握數據挖掘中高維數據分析方法及其實際應用

1.LASSO

2.SCAD

3.MCP

4.Group  LASSO

案例1:基因篩選

案例2: 股票選股

6(3小時)

無監督學習

主成分分析

主成分回歸

聚類分析

目標:掌握無監督學習方法及其应用。

1.主成分分析

2.主成分回歸

3.Kmeans聚類分析

4.系统聚類分析

案例1:廣告支出主成分分析

案例2:犯罪率主成分分析

案例3:學生考試成績主成分分析

案例4:客戶細分聚類案例


往期京滬現場班:

[查看圖片]

[查看圖片]


優惠:

現場班老學員9折優惠;
同一單位三人以上同時報名9折優惠;

以上優惠不疊加。


報名流程:
1:点击“初级班/高级班/全程班報名”,网上填写信息提交;
2:給予反饋,確認報名信息;
3:網上訂單繳費(需要刷卡或對公轉賬的請報名後與我們聯系);
4:开课前一周发送课程电子版講义,软件准备及交通住宿指南。

聯系方式:
魏老師
QQ:28819897142881989714
Mail:vip@pinggu.org
Tel:010-68478566

全部回複
weinamaleny 2018-6-29 08:55:54
方老師每年寒暑假開班
-想學習R語言
-看過方老師的書覺得還不夠
-後續工作或者學習對R語言有需求
-不知道怎麽處理目前的R相關的項目
……
都適合參加學習,等你來
資料狂人 2018-6-29 08:57:46
R語言由新西蘭奧克蘭大學Ross和Robert開發。

R語言是自由軟件,可以放心大膽地使用,且具有非常強大的統計分析和作圖功能,而且更重要的是R軟件具有非常豐富的網上資源,目前R軟件有3000多種貢獻包,幾乎可以實現所有的統計方法,目前大部分的統計學家和計量經濟學家都使用R語言,而且越來越多的數據分析實務人員也開始使用R語言。

R語言具有簡單易學,功能強大,體積小(僅40m左右),完全免費,可自由開發等特點,且R語言和S語言語法基本相同,絕大部分程序是互相兼容的。學習R軟件正成爲一種趨勢。
R软件优美的地方是它能够修改很多前人编写的包的代码做各种你所需的事情,实际你是站在巨人的肩膀上。——Google首席经济学家Hal Varian
阿扁V5 2018-6-29 08:58:36
資料狂人 2018-6-29 09:07:51
如果你平時的工作會涉及到統計學,那麽接觸R語言實在是太正常不過了。因爲R語言本身爲統計而生,所以你能想到的所有統計相關的工作,R都可以非常簡潔的用幾行命令(甚至1行命令)幫你完成。
       在R官网有这样几句介绍:“R provides a wide variety of statistical (linear and nonlinear modelling, classical statistical tests, time-series analysis, classification, clustering, …) and graphical techniques, and is highly extensible.  One of R's strengths is the ease with which well-designed publication-quality plots can be produced, including mathematical symbols and formulae where needed.”
        * R高度的可扩展性正是体现在它那1万多个包上,你想做的几乎所有事情都可以用现有的R包来辅助完成(当然,有些工作即便能完成但也不适合)。
        * R另一个杀手锏就是其强大的绘图功能,正如上面的英文介绍所言,R可以画图,画各种各样的图,画各种各样高逼格的图,画各种各样高逼格可以直接出版的图。
       * 完善的统计学功能再加上强大的绘图功能,就是你学习的理由。
tututu 2018-6-29 09:31:13
支持一下
幸運符 2018-6-29 09:41:39
cszcszcsz 2018-6-29 10:17:14
961938985 2018-6-29 10:25:08
支持一下
nndbc 2018-6-29 10:39:48
首頁上一頁下一頁跳至第

回到電腦版
回帖 發帖 收藏 看本版