1.點擊下面按鈕復制微信號
點擊復制微信號
上海威才企業管理咨詢有限公司
商業數據挖掘分析是通過算法對大量商業數據進行探索并最終找出隱藏于數據背后的高價值信息及知識的方法。數據挖掘分析方法是一種商業決策支持過程,它可以高度自動化地對企業商業數據進行分析,做出歸納性推理,從中挖掘出潛在模式規律,最終幫助決策者做出正確經營決策。
近年來,數據挖掘引起了信息產業界的極大關注,其主要原因是企業存在大量可廣泛應用的有效數據,并且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛應用于企業生產經營中的各個方面,包括但不限于生產管理、質量控制、市場分析、營銷管理、運營管理、財務管理、人力管理等……學習該課程可以系統培養數據分析人員的數據挖掘分析能力,幫助企業從數據中:
● 發現數據背后深層業務問題
● 找到突破業務增長瓶頸的突破口
● 找到業務行為模式的最優解
● 洞察市場先機以及經營風險,預測未來經營走勢
● 掌握數據挖掘分析工具Python的使用方法;
● 掌握Python數據清洗方法;
● 掌握統計分析方法;
● 掌握多種算法模型的使用方法;
● 掌握商業數據挖掘分析實戰方法。
Python語言基礎:幫助學員掌握Python語言的基礎編程方法,掌握應用Python進行數據加載、數據整理、數據清洗、數據可視化等方法,本節內容為后續內容奠定工具應用基礎;
1. Python編程基礎(Python安裝啟動、數據類型、控制流操作、函數、面向對象編程、文件操作)
2. Python加在數據(向量\矩陣\數組、加在樣本數據集、加在數據文件數據、查詢SQL數據庫)
3. Python數據整理(創建及瀏覽數據幀、處理缺失值、數據替換、連接及合并數據幀、數據分組聚合、更改數據類型等)
4. Python數據清洗(Numpy應用方法、Pandas應用方法)
5. Python數據可視化(Matplotlib繪圖、Pandas繪圖、Pyecharts交互式圖表繪制)
6. 綜合案例應用
時間序列分析:時間序列分析是一種重要的定量預測分析方法,本節將幫助學員系統掌握時間序列分析方法;
1. Pandas時間序列處理
2. 時間序列特征
3. 時間序列模型應用(AR、MA、ARMA、ARIMA)
4. 時間序列建模
5. 綜合案例應用
機器學習與數據挖掘基礎:本節內容將為大家介紹機器學習與數據挖掘的基礎理論知識,并針對有監督學習算法以及無監督學習算法進行展開介紹;
1. 機器學習與數據挖掘理論基礎(數據挖掘概要,數據挖掘方法論,機器學習基本思想、常用算法分類、主要解決的問題,機器學習流程,模型評價指標,算法庫等)
2. 有監督學習算法入門(KNN基本原理,函數詳解,KNN數據結構實現,KNN算法實例)
3. 無監督學習算法入門(聚類分析入門,K-Means快速聚類基本原理,K-Means快速聚類手動實現,K-Means模型評估指標及穩定性討論,輪廓系數)
機器學習與數據挖掘進階:本節將為大家進一步介紹機器學習與數據挖掘的進階算法以及應用案例;
1. 常用有監督學習算法(線性回歸(線性回歸模型的推導和求解,梯度下降法,帶正則項的線性回歸),邏輯回歸(邏輯回歸的引入,sigmoid函數,模型的求解,多分類問題),貝葉斯(樸素貝葉斯,貝葉斯網絡),SVM支持向量機分類和支持向量機回歸(線性SVM,硬邊距與軟邊距,非線性SVM,核函數的理解)
2. 有監督學習算法進階(決策樹模型(C4.5、C5.0和CART樹,決策樹的可視化),集成學習基礎(集成學習思想,分類,boosting和bagging聯系與區別),集成算法之Bagging類算法(Bagging、隨機森林等),集成算法之Boosting類算法(Adaboosting、GBDT梯度提升樹、XgBoost等)
3. 無監督學習算法進階(聚類分析:DBSCAN密度聚類、層次聚類等,數據降維方法(PCA主成分分析和SVD奇異值分解)
4. 特征工程與高級數據預處理(特征工程的目的與重要性,特征預處理(無量綱化,分析,編碼,統計編號,特征組合),特征構造(時間和時間序列特征構造,空間特征構造,用戶行為特征構造,文本特征構造,圖像特征構造),特征選擇(特征選擇標準,方法分類),特征轉換與特征學習)
文本分析:文本數據中包含大量有用信息,使用文本分析方法可以有效提取這部分信息為商業決策提供幫助。本節內容將幫助學員系統掌握應用Python進行文本分析的方法;
1. 文本分析概述(文本數據與文本挖掘,自然語言處理的流派,文本挖掘常見商業應用,自然語言處理的層次,流程與挑戰)
2. 獲取文本數據(語料和語料庫,常見語料庫,語料庫的獲取,文本的爬取)
3. 文本向量化(離散化表示方法(詞集模型,詞袋模型,TF-IDF),分布式表示方法(word2vec,glove))
4. 文本分類與聚類(百度數據聚類,新聞分類,情感分類)
5. 基于深度學習的文本分析(深度學習在文本分析中的應用,基于LSTM的情感分析,基于深度學習的新聞分類)
圖像處理與分析:除了文本數據之外,圖像數據同樣蘊藏了大量有價值的信息與知識,本節將幫助學員系統掌握圖像數據的處理與分析方法;
1. 圖像處理基本概念(位圖,灰度,通道,深度,色相,色調,圖像分辨率,顏色模型(RGB,HSI,HSV))
2. 基于OpenCV的圖像處理(OpenCV基本介紹,圖像和視頻的獲取,圖像裁剪、通道獲取邊界填充,圖像計算,調亮圖片,改變圖像大小圖像融合,閾值處理,圖像濾波,圖像運算,圖像金字塔)
3. 圖像特征的理解與計算(顏色特征,形狀特征,LBP特征,HAAR特征,HOG特征)
4. 基于卷積神經網絡的圖像處理(卷積神經網絡的模型搭建和訓練,常見卷積神經網絡結構分析)
5. 基于卷積神經網絡的圖像分類實戰(基于卷積神經網絡的人臉識別實戰)
綜合應用案例(大綱只列舉部分典型案例,可以根據企業實際需求進行選擇或定制):本節通過多個實戰案例將前邊相關知識進行串聯、鞏固與提高,幫助學員將所學應用到實際商業場景下,掌握商業數據挖掘分析的全流程方法;
1. 電商案例分析(統計描述性,宏觀市場和微觀市場分析,波士頓矩陣分析)
2. 航空客戶價值分析(RFM分析,客戶畫像,聚類分析,精準營銷)
3. 保險行業用戶畫像,精準營銷(決策樹應用)
4. 航班動態延誤預測(隨機森林,集成學習應用)
5. 基于不同場景之下共享單車投放量的精準預測(嶺回歸,lasso回歸)
6. 京東用戶商品購買預測(xgboost集成學習)
7. 電商銷售商品數據分析(關聯規則應用)
8. 門戶網站新聞分類分析(貝葉斯應用)
9. 手寫數字識別案例(邏輯回歸,knn應用)
10. 人臉識別與分類案例(SVM應用)
11. 圖像分類(CNN應用)
12. 電商文本情感分析(LSTM應用)
13. 數字化人力資源之員工流失風險預警(邏輯回歸應用)
14. 基于用于欺詐檢測的綜合財務數據集預測金融支付服務中的欺詐行為(集成學習應用)
15. 信用評分卡案例
例: 講解獲取外部數據
例: 講解應用文本分析對網站注冊用戶特征需求進行分析
聯系電話:4006-900-901
微信咨詢:威才客服
企業郵箱:shwczx@www.zrhfdc888.com
深耕中國制造業
助力企業轉型
2021年度咨詢客戶數
資深實戰導師
客戶滿意度
續單和轉介紹