這是我個人在DIGI+Talent數位網路學院

Python資料分析課程的完課測驗中

統整的一些題目及解答

希望對大家有所幫助

 

以下程式會找出哪一種資料內容?

df.groupby('animal')['age'].median()

['animal']欄位分組後,各種動物的數量

['animal']欄位分組後,各種動物的年齡中位數

['age']欄位分組後,各種動物的年齡中位數

['age']欄位分組後,各種動物的數量

 

關於資料分析定義,下列何者為誤?

資料分析透資料處理的方法達到目的

資料分析不能透過圖表來呈現結論

資料分析的目的是找出結論

資料分析可以透過電腦程式來增加效率

 

Python資料處理套件panda中,群組計算語法為何?

groupby

summarise

aggregate

groupup

 

Python 套件中matplotlib 組件要畫出資料分佈的直方圖,要用什麼方法

bar

scatter

hist

plot

 

哪一行程式會在pandas下找出dataframeage欄位在行2,4間(不含2,4)的值?

df [ (df['age']>2) or (df['age']<4) ]

 df [ (df['age']>2) and (df['age']<4) ]

(df['age']>2) and (df['age']<4)

(df['age']>2) or (df['age']<4)

 

Classification模型不可以用哪一種方法來評估模型的效能?

 決定係數R2

ROC/AUC

混淆矩陣 Confusion Matrix

F1 Score

 

下列對於numpy套件的敘述何者為錯誤?

numpy在大量運算時有非常優異的效能。

numpyndarray是由許多相同資料型別的元素所組成

 大量資料的矩陣運算上 Numpy 的效能表現差於 Python 本身的 list 運算

numpy 可以產生一維、二維陣列進行向量(vector)和矩陣(matrix)運算

 

Python中要引用套件的指令,哪一個是錯誤的?

import pandas as pd

● from matplotlib import pyplot.plt

from sklearn.metrics import accuracy_score

import numpy

 

下列Python的套件中,何者不適用於資料分析的工作?

matplotlob

pandas

 flask

numpy

 

以下程式碼執行後會不會有錯誤輸出?
list= [‘a’,’e’,’i’,’o’,’u’]
print (list [8:])

會有錯誤輸出,為KeyError

不會有錯誤輸出,會輸出 'u'

 不會有錯誤輸出,會輸出 []

會有錯誤輸出,為IndexError

 

Pandas中使用的標準資料缺失標誌是什麼?

 NaN

Null

0

None

 

資料分析中,管道機制(pipeline)的作用何者為誤?

有效地重複訓練與驗證

方便版本控制與部署

方便資料準備

 防止資料外洩風險

 

請按照下列敘述,選出對應正確的答案
df = pd. _____ ('test.csv', encoding='utf-8', sep=';')
空格中該填入何指指令,以讀取csv檔?

read_json

 read_csv

read_html

read_excel

 

下列何者是pandas的資料類型?

Dataset

 Dataframe

Datacluster

Datalake

 

對於下列程式的敘述何者為正確?
df[df['age'] > 3]判斷age欄位中,是否為大於3的值

 取出age欄位中,age值大於3row

取出age欄位中,age值大於3的值

取出age欄位中,age值大於3column

 

Python爬蟲技術中,哪一個是不必要的?

抓取資料

 分享資料

儲存資料

分析資料

 

下列哪一個Python套件可以用來"解析"抓取的網頁資料內容?

 lBeautifulSoup

os.path

tkinter

math

 

下列何者不是資料分析的特徵工程的內容?

Feature Transformation 特徵轉換

Feature Understanding 特微理解

Feature Selection 特徵選擇

 Feature Counting 特微計數

 

 多項式迴歸 (Polynomial regression)中表示二次式模型,則公式正確表示為何?

 Y ~ X + I(X^2)

Y ~ X + X^2 + 1

○ Y ~ X + X*2

○ Y ~ X + X^2

 

下列對於混淆矩陣 (Confusion matrix) 的敘述何者為正確?

● TP 真陽性率為實際為陽性的樣本中,判斷為陽性的比例。

TP 真陽性率,愈小愈好。

FP 假陽性率,愈大愈好。

TP 真陽性率=真陽數/(真陽數+假陽數) 

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 虎頭蛇尾 的頭像
    虎頭蛇尾

    虎頭蛇尾的部落格

    虎頭蛇尾 發表在 痞客邦 留言(0) 人氣()