簡介:數(shù)據(jù)診斷是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的第一步,然而卻被很多人忽略掉了。如果對數(shù)據(jù)本身不了解的話,容易受到嚴(yán)謹(jǐn)?shù)臉I(yè)務(wù)人的挑戰(zhàn),同時,如果缺少了數(shù)據(jù)診斷的步驟,會增加后面數(shù)據(jù)預(yù)處理的難度,從而影響最終模型的效果。因此,本課程教授大家如何制作一個高效的,復(fù)用性高的,讓人更好地理解數(shù)據(jù)本身的數(shù)據(jù)診斷工具。
第2章 數(shù)據(jù)診斷整體介紹
數(shù)據(jù)獲取和數(shù)據(jù)讀取,統(tǒng)計指標(biāo)的介紹與簡單示例
第3章 數(shù)據(jù)診斷工具制作
工具制作-依賴包的介紹,工具制作-缺失值和方差,工具制作-特殊描述值,工具制作-基本描述統(tǒng)計值,工具制作-功能整合
第4章 數(shù)據(jù)診斷工具驗證
工具驗證-數(shù)據(jù)正確性,工具驗證-效率