單項選擇題企業(yè)要建立預(yù)測模型,需準備建模數(shù)據(jù)集,以下四條描述建模數(shù)據(jù)集正確的是()

A.數(shù)據(jù)越多越好
B.盡可能多的適合的數(shù)據(jù)
C.數(shù)據(jù)越少越好
D.以上三條都不正確


您可能感興趣的試卷

你可能感興趣的試題

1.單項選擇題一條關(guān)聯(lián)規(guī)則為A→B,此規(guī)則的信心水平(confidence)為60%,則代表()

A.買B商品的顧客中,有60%的顧客會同時購買A
B.同時購買AB兩商品的顧客,占所有顧客的60%
C.買A商品的顧客中,有60%的顧客會同時購買B
D.兩商品AB在交易數(shù)據(jù)庫中同時被購買的機率為60%

2.單項選擇題Naive Bayes是屬于數(shù)據(jù)挖掘中的什么方法?()

A.聚類
B.分類
C.時間序列
D.關(guān)聯(lián)規(guī)則

3.單項選擇題當一個連續(xù)變量的缺失值占比在85%左右時,以下哪種方式最合理()

A.直接使用該變量
B.根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量
C.使用多重插補的方法進行缺失值填補
D.直接刪除該變量

4.單項選擇題在對歷史數(shù)據(jù)集進行分區(qū)之前進行數(shù)據(jù)清洗(缺失值填補等)的缺點是什么()

A.違反了建模的假設(shè)條件
B.加大了處理的難度
C.無法針對分區(qū)后各個數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗
D.無法對不同數(shù)據(jù)清理的方法進行比較,以選擇最優(yōu)方法

7.單項選擇題下面關(guān)于聚類分析說法錯誤的是()

A.一定存在一個最優(yōu)的分類
B.聚類分析是無監(jiān)督學(xué)習(xí)
C.聚類分析可以用于判斷異常值
D.聚類分析即:物以類聚,人以群分

8.單項選擇題以下哪個類型的變量在作預(yù)測客戶流失的模型中最有解釋力度?()

A.人口基本數(shù)據(jù),比如年齡和性別
B.基本社會狀態(tài)數(shù)據(jù),比如收入和職業(yè)
C.業(yè)務(wù)數(shù)據(jù),比如消費頻次
D.業(yè)務(wù)數(shù)據(jù)的衍生變量,比如最近3個月消費頻次的變化情況

9.單項選擇題以下哪個變量可以反映客戶的忠誠度?()

A.購買頻次
B.購買金額
C.最后一次購買時間
D.購買金額波動率

10.單項選擇題假如學(xué)生考試成績以“優(yōu)”.“良”.“及格”和“不及格”來記錄,為了說明全班同學(xué)考試成績的水平高低,其集中趨勢的測度()

A.可采用算術(shù)平均數(shù)
B.可以采用眾數(shù)或中位數(shù)
C.只能采用眾數(shù)
D.只能采用四分位數(shù)