華為認證

當前位置 /首頁/IT認證/華為認證/列表

HCNP-Big Data-Developer V1.0試題及答案

1.(判斷題) HDFS採用的是“一次寫入、多次讀取”的檔案訪問模型。所以推薦一個檔案經過建立、寫入和關閉之後,就不要再去修改。

HCNP-Big Data-Developer V1.0試題及答案

A. True B. False

2.(多選題) HDFS的應用開發中,下列哪些是HDFS服務支援的介面?

A. e

B. h

C. te

D. nd

3. (多選題) 關於kinit操作命令,如下哪些說法是錯誤的?

A. 只能使用人機賬號。

B. 只能使用機機賬號。

C. 一個客戶端不支援多個賬號同時使用。

D. 執行此命令得到的票據在24小時後會超時,需再次執行kinit命令去重新登入。

4.(多選題)對於HBase Rowkey的設計原則,如下描述正確的是?

A. 訪問權重高的屬性值放在Rowkey前面。

B. 訪問權重高的屬性值放在Rowkey後半部分。

C. 離散度好的屬性值放在Rowkey前半部分。

D. 離散度好的屬性值放在Rowkey後半部分。

5.(單選題)HBase表的Rowkey設計是一個很重要的開發設計環節。假設存在如下場景,最頻繁的查詢場景是基於手機號查詢每個月、每半年的歷史通話記錄,以下哪個Rowkey設計是最優的?

A. 姓名+手機號 B. 日期+手機號

C. 手機號+日期 D. 手機號+姓名

6.(單選題) FusionInsight HD中,關於Hive的分割槽(partition)功能,如下描述錯誤的是?

A. 分割槽欄位要在建立表時定義。

B. 分割槽欄位只能有一個,不可以建立多級分割槽。

C. 使用分割槽,可以減少某些查詢的資料掃描範圍,進而提高查詢效率。

D. 分割槽欄位可以作為where字句的條件。

7.(判斷題) FusionInsight HD系統的V100R002C60版本中,Hive僅支援基於MapReduce引擎的查詢服務,不支援基於Spark引擎的查詢服務。

A. True

B. False

8.(單選題) FusionInsight HD中,對Solr各類資源的建立和讀寫許可權使用,以下說法錯誤的`是?

A. Solr使用者組使用者可以建立配置集,並在建立Collection時指定該配置集。

B. Solr使用者組的使用者可以建立Collection。

C. Collection建立者、對該Collection具有讀寫許可權的角色以及Solr admin角色可以對Collection進行更新。

D. 只有Collection建立者和Solr admin角色可以刪除Collection。

9.(多選題) 在Solr的應用查詢場景中,當對查詢結果深度翻頁時,需使用遊標進行深度翻頁。下面對遊標說法正確的是?

A. 必須對查詢欄位進行排序。

B. 必須對uniqueKey欄位進行排序。

C. 第一次查詢請求時,需指定查詢引數,操作方法如下:

(OR_MARK_PARAM, OR_MARK_START);

D. 查詢時,請求中不能帶有start引數。

E. Solr的返回結果中會有nextCursorMark,在下次呼叫時使用這個值作為cursorMark。

10.(多選題)關於Kafka的Producer,如下說法正確的是?

A. Producer是訊息生產者。

B. Producer生產資料需要指定Topic。

C. 可以同時起多個Producer程序向同一個Topic進行資料傳送。

D. Producer生產資料時需要先連線ZooKeeper,而後才連線Broker。

11.(單選題) 在FusionInsight HD產品中,關於Kafka安全和非安全埠描述錯誤的是?

(注:舊API是指舊Producer API和舊Consumer API。其中,舊Consumer API:是指umerConnector中定義的介面;舊Producer API:是指ucer中定義的介面。)

A. Kafka叢集安全訪問埠預設為21007,非安全訪問埠預設為21005。

B. 舊API通過21005埠訪問某個Topic的前提是:服務端引數d設定為true,且此Topic未設定ACL屬性。

C. 舊API僅支援訪問21005埠;新API相容訪問非安全埠21005和安全埠21007。

D. 對於設定了ACL的Topic,可以使用舊API連線21005埠進行訪問。

12.(判斷題)在一個MapReduce應用程式中,map函式的輸出經由MapReduce框架處理後,傳送到reduce函式。這個處理過程是基於鍵值對進行排序和分組的。

A. True

B. False

13.(判斷題)在FusionInsight HD中,Spark預設採用YARN作為叢集資源管理系統。

A. True

B. False

14.(單選題)Spark應用的計算邏輯會被解析成DAG,這個解析操作由以下哪個功能模組完成?

A. Client

B. ApplicationMaster

C. Executor

D. Driver

15.(單選題)在Flume中,source功能模組的主要作用是?

A. 獲取資料,並將原始資料轉化成自己處理的資料物件。

B. 快取資料,根據不同的可靠性策略,將資料儲存在記憶體或檔案上。

C. 輸出資料到目的地,支援多種輸出協議。

D. 拆分資料,根據資料的特性,將資料傳送到不同的目的地。

16.(單選題) 關於Streaming的拓撲(Topology),下面描述錯誤的是?

A. 一個Topology是由一組Spout元件和Bolt元件通過Stream Groupings進行連線的有向無環圖(DAG)。

B. Topology會一直執行,直到它被顯式kill。

C. 業務邏輯都被封裝進Topology中。

D. 一個Topology只可以指定啟動一個Worker程序。

17.(單選題) 假設一個應用有10個表,每個表記錄數為千萬級別,欄位數約20個。現使用Redis來快取這10個表的資料,對其資料結構的設計,以下哪一項是最佳設計?

A. 採用hash結構,且一個表使用一個hash KEY,表中一行記錄對於hash KEY的一個field。

B. 採用hash結構,每個表的每一行記錄使用一個hash KEY,hash KEY的field對應表記錄的欄位,且設計KEY時每個表新增不同的字首進行區分。

C. 採用string結構,每個表的每一行記錄的每個欄位使用一個KEY。

D. 採用string結構,每個表的每一行記錄使用一個KEY,value為表中一行記錄的所有欄位拼接後的值。

18.(多選題) FusionInsight HD中,在使用Streaming的ACK機制時,下列哪些說法是正確的?

A. 啟用了Acker之後,Streaming會識別傳送失敗的Tuple並自動重發,無需人為干預。

B. Acker會標識處理超時或者處理失敗的訊息為fail。

C. 從spout開始,形成的Tuple樹中任何一個環節失敗都會標記整棵樹失敗。

D. 應用需要在spout的fail()介面方法中實現訊息重發邏輯。

19.(多選題)在Spark中,關於廣播變數以下說法正確的是?

A. 廣播變數在每個Task中儲存一份 。

B. 廣播變數在每個Executor中儲存一份。

C. 廣播變數是隻讀的。

D. 廣播變數通過dcast()方法生成。

20.(單選題)在Spark中,假設lines是一個DStream物件,filter語句可以過濾掉80%的資料,針對以下兩個語句說法正確的是:

X: er(...)pByKey(...)

Y: pByKey(...)er(...)

A. X比Y的效能更高

B. X比Y的效能更低

C. X和Y和效能一樣

D. 無法確性X和Y的效能差異

  【參考答案

1. A 3. ABC 5.C 6.B 7.A 8.A 9. BCDE 10. ABC 11.D 12.A 13.A 14.D 15.A 16.D 17.B 18. BCD 19. BCD 20.A

TAG標籤:data Developer 試題 v10 hcnp #