這是我個人在DIGI+Talent數位網路學院
Python資料分析課程的完課測驗中
統整的一些題目及解答
希望對大家有所幫助
以下程式會找出哪一種資料內容?
df.groupby('animal')['age'].median()
○ 以['animal']欄位分組後,各種動物的數量
● 以['animal']欄位分組後,各種動物的年齡中位數
○ 以['age']欄位分組後,各種動物的年齡中位數
○ 以['age']欄位分組後,各種動物的數量
關於資料分析定義,下列何者為誤?
○ 資料分析透資料處理的方法達到目的
● 資料分析不能透過圖表來呈現結論
○ 資料分析的目的是找出結論
○ 資料分析可以透過電腦程式來增加效率
Python資料處理套件panda中,群組計算語法為何?
● groupby
○ summarise
○ aggregate
○ groupup
Python 套件中matplotlib 組件要畫出資料分佈的直方圖,要用什麼方法 ?
○ bar
○ scatter
● hist
○ plot
哪一行程式會在pandas下找出dataframe中age欄位在行2,4間(不含2,4)的值?
○ df [ (df['age']>2) or (df['age']<4) ]
● df [ (df['age']>2) and (df['age']<4) ]
○ (df['age']>2) and (df['age']<4)
○ (df['age']>2) or (df['age']<4)
Classification模型不可以用哪一種方法來評估模型的效能?
● 決定係數R2
○ ROC/AUC
○ 混淆矩陣 Confusion Matrix
○ F1 Score
下列對於numpy套件的敘述何者為錯誤?
○ numpy在大量運算時有非常優異的效能。
○ numpy的ndarray是由許多相同資料型別的元素所組成
● 大量資料的矩陣運算上 Numpy 的效能表現差於 Python 本身的 list 運算
○ numpy 可以產生一維、二維陣列進行向量(vector)和矩陣(matrix)運算
在Python中要引用套件的指令,哪一個是錯誤的?
○ import pandas as pd
● from matplotlib import pyplot.plt
○ from sklearn.metrics import accuracy_score
○ import numpy
下列Python的套件中,何者不適用於資料分析的工作?
○ matplotlob
○ pandas
● flask
○ numpy
以下程式碼執行後會不會有錯誤輸出?
list= [‘a’,’e’,’i’,’o’,’u’]
print (list [8:])
○ 會有錯誤輸出,為KeyError
○ 不會有錯誤輸出,會輸出 'u'
● 不會有錯誤輸出,會輸出 []
○ 會有錯誤輸出,為IndexError
Pandas中使用的標準資料缺失標誌是什麼?
● NaN
○ Null
○ 0
○ None
資料分析中,管道機制(pipeline)的作用何者為誤?
○ 有效地重複訓練與驗證
○ 方便版本控制與部署
○ 方便資料準備
● 防止資料外洩風險
請按照下列敘述,選出對應正確的答案
df = pd. _____ ('test.csv', encoding='utf-8', sep=';')
空格中該填入何指指令,以讀取csv檔?
○ read_json
● read_csv
○ read_html
○ read_excel
下列何者是pandas的資料類型?
○ Dataset
● Dataframe
○ Datacluster
○ Datalake
對於下列程式的敘述何者為正確?
○ df[df['age'] > 3]判斷age欄位中,是否為大於3的值
● 取出age欄位中,age值大於3的row
○ 取出age欄位中,age值大於3的值
○ 取出age欄位中,age值大於3的column
在Python爬蟲技術中,哪一個是不必要的?
○ 抓取資料
● 分享資料
○ 儲存資料
○ 分析資料
下列哪一個Python套件可以用來"解析"抓取的網頁資料內容?
● lBeautifulSoup
○ os.path
○ tkinter
○ math
下列何者不是資料分析的特徵工程的內容?
○ Feature Transformation 特徵轉換
○ Feature Understanding 特微理解
○ Feature Selection 特徵選擇
● Feature Counting 特微計數
多項式迴歸 (Polynomial regression)中表示二次式模型,則公式正確表示為何?
● Y ~ X + I(X^2)
○ Y ~ X + X^2 + 1
○ Y ~ X + X*2
○ Y ~ X + X^2
下列對於混淆矩陣 (Confusion matrix) 的敘述何者為正確?
● TP 真陽性率為實際為陽性的樣本中,判斷為陽性的比例。
○ TP 真陽性率,愈小愈好。
○ FP 假陽性率,愈大愈好。
○ TP 真陽性率=真陽數/(真陽數+假陽數)