최신 Professional-Data-Engineer日本語 무료덤프 - Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)

문제1

Google の Dataflow SDK を使用して、以下に示すような顧客データを分析する予定です。プロジェクトの要件は、データソースから顧客名のみを抽出し、出力 PCollection に書き込むことです。
トム、555 X 通り
ティム、553 Yストリート
サム、111 Z ストリート
上記のデータ処理要件に最適な操作はどれですか?

A. ソースAPI

B. パルド

C. シンクAPI

D. データ抽出

정답: B

설명: (DumpTOP 회원만 볼 수 있음)

문제2

Compute Engine 仮想マシン (n2-standard -32) 上の TensorFlow 機械学習モデルでは、フレーミングを完了するのに 2 日かかります。モデルには、CPU 上で部分的に実行する必要があるカスタム TensorFlow 操作が含まれています。コスト効率の高い方法でトレーニング時間を短縮したいと考えています。どうすればよいでしょうか。

A. GPUハードウェアアクセラレータを備えたVMを使用してモデルをトレーニングする

B. TPUハードウェアアクセラレータを備えたVMを使用してモデルをトレーニングする

C. VMタイプをe2 standard-32に変更します

D. VMタイプをn2-highmem-32に変更します

정답: A

문제3

Cloud Bigtable のパフォーマンスが低下する正当な理由ではないのはどれですか?

A. テーブルのスキーマが正しく設計されていません。

B. ネットワーク接続に問題があります。

C. ワークロードは Cloud Bigtable に適していません。

D. Cloud Bigtable クラスタのノードが多すぎます。

정답: D

설명: (DumpTOP 회원만 볼 수 있음)

문제4

パーティション化されたテーブルにデータを格納する方法としてサポートされていないのはどれですか?

A. 既存のデータが日ごとに別々のファイルに保存されている場合は、パーティションテーブルを作成し、各ファイルを適切なパーティションにアップロードします。

B. ORDER BY を使用してテーブルの行を時系列順に並べ、テーブルの種類を「パーティション化」に変更します。

C. クエリを実行して、既存のテーブルから特定の日付のレコードを取得し、宛先テーブルには、日付が「$YYYYMMDD」の形式で終わるパーティションテーブルを指定します。

D. パーティション化されたテーブルを作成し、毎日新しいレコードをそこにストリーミングします。

정답: B

설명: (DumpTOP 회원만 볼 수 있음)

문제5

BigQuery ML を使用して機械学習モデルを作成し、Vertex AI を使用してモデルをホストするためのエンドポイントを作成したいと考えています。これにより、複数のベンダーからの継続的なストリーミングデータをほぼリアルタイムで処理できるようになります。データには無効な値が含まれている可能性があります。どうすればよいでしょうか。

A. 新しい BigOuery データセットを作成し、ストリーミング挿入を使用して複数のベンダーからデータを取得します。BigQuery ML モデルを構成して、「取り込み」データセットをトレーニングデータとして使用します。

B. BigQuery ストリーミング挿入を使用して、BigQuery データセット ML モデルがデプロイされている複数のベンダーからデータを取得します。

C. Pub'Sub トピックを作成し、すべてのベンダーデータをそのトピックに送信します。トピックに Cloud Functions を接続してデータを処理して BigQuery に保存します。

D. Pub/Sub トピックを作成し、すべてのベンダーデータをそのトピックに送信します。Dataflow を使用して Pub/Sub データを処理およびサニタイズし、BigQuery にストリーミングします。

정답: D

설명: (DumpTOP 회원만 볼 수 있음)

문제6

あなたは、eコマース会社向けのバスケット放棄システムを設計しています。システムは、次のルールに基づいてユーザーにメッセージを送信します。
1時間、サイト上でユーザーによる操作がない
30ドル以上の商品をカートに追加しました
取引が完了していない
Google Cloud Dataflow を使用してデータを処理し、メッセージを送信するかどうかを決定します。パイプラインをどのように設計すればよいでしょうか?

A. 60 分間の固定時間ウィンドウを使用します。

B. 60 分の遅延を持つ時間ベースのトリガーを持つグローバルウィンドウを使用します。

C. ギャップ時間が 60 分のセッションウィンドウを使用します。

D. 期間が 60 分のスライディングタイムウィンドウを使用します。

정답: C

문제7

組織では、6 か月間 Google BigQuery でデータを収集し、分析してきました。分析されたデータの大部分は、events_partitioned という時間パーティションテーブルに格納されています。クエリのコストを削減するために、組織では events というビューを作成しました。このビューは、過去 14 日間のデータのみをクエリします。このビューは、レガシー SQL で記述されています。来月、既存のアプリケーションは BigQuery に接続し、ODBC 接続を介してイベントデータを読み取ることになります。アプリケーションが接続できることを確認する必要があります。実行する必要があるアクションはどれですか (2 つ選択してください)。

A. 標準SQLを使用してイベントの新しいビューを作成する

B. 標準SQLクエリを使用して新しいパーティションテーブルを作成します

C. 認証に使用するODBC接続のサービスアカウントを作成します

D. 標準SQLを使用してevents_partitionedの新しいビューを作成します。

E. ODBC 接続と共有「イベント」用の Google Cloud Identity and Access Management（Cloud IAM）ロールを作成します。

정답: A,E

문제8

図書館の書籍と、著者や出版年などの各書籍の情報を追跡するアプリケーションをオンプレミスのデータウェアハウスから BigQuery に移行しています。現在のリレーショナルデータベースでは、著者情報は別のテーブルに保存され、共通キーで書籍情報に結合されています。Google が推奨するスキーマ設計方法に基づいて、借りた各書籍の著者に関するクエリの速度を最適化するには、データをどのように構造化すればよいでしょうか。

A. スキーマを同じに保ち、すべてのテーブルを結合するビューを作成し、常にビューをクエリします。

B. 著者の名、姓、生年月日など、各属性の列を含む幅の広いテーブルを作成します。

C. スキーマを同じままにして、本と各属性の異なるテーブルを維持し、今日と同じようにクエリを実行します。

D. 書籍と著者に関する情報を含むテーブルを作成しますが、著者フィールドを著者列内にネストします。

정답: D

문제9

データを Cloud Storage にアーカイブしたいと考えています。一部のデータは非常に機密性が高いため、「Trust No One」(TNO) アプローチを使用してデータを暗号化し、クラウドプロバイダーのスタッフがデータを復号化できないようにしたいと考えています。どうすればよいでしょうか。

A. gcloud kms keys create を使用して対称鍵を作成します。次に、gcloud kms encrypt を使用して、各アーカイブファイルを鍵で暗号化します。gsutil cp を使用して、暗号化された各ファイルを Cloud Storage バケットにアップロードします。暗号化に使用した鍵を手動で破棄し、鍵を 1 回ローテーションして、鍵を 1 回ローテーションします。

B. gcloud kms keys create を使用して対称鍵を作成します。次に、gcloud kms encrypt を使用して、鍵と一意の追加認証データ (AAD) を使用して各アーカイブファイルを暗号化します。gsutil cp を使用して、暗号化された各ファイルを Cloud Storage バケットにアップロードし、AAD を Google Cloud の外部に保持します。

C. .boto 構成ファイルで顧客指定の暗号鍵 (CSEK) を指定します。gsutil cp を使用して、各アーカイブファイルを Cloud Storage バケットにアップロードします。CSEK をシークレットの永続ストレージとして Cloud Memorystore に保存します。

D. .boto 構成ファイルで顧客指定の暗号化キー (CSEK) を指定します。gsutil cp を使用して、各アーカイブファイルを Cloud Storage バケットにアップロードします。セキュリティチームだけがアクセスできる別のプロジェクトに CSEK を保存します。

정답: A

문제10

時系列指標を集約して Cloud Bigtable に書き込む Cloud Dataflow ジョブを含むデータパイプラインがあります。このデータは、組織全体の何千人ものユーザーが使用するダッシュボードに送られます。同時ユーザー数を増やし、データの書き込みにかかる時間を短縮する必要があります。次の 2 つのアクションのうち、どれを実行する必要がありますか。(2 つ選択してください。)

A. Cloud Bigtable に書き込む前に Flatten 変換を使用するように Cloud Dataflow パイプラインを変更します。

B. ローカル実行を使用するように Cloud Dataflow パイプラインを構成する

C. PipelineOptions で maxNumWorkers を設定して、Cloud Dataflow ワーカーの最大数を増やします。

D. Cloud Bigtable クラスタ内のノード数を増やす

E. Cloud Bigtable に書き込む前に CoGroupByKey 変換を使用するように Cloud Dataflow パイプラインを変更します。

정답: C,D

설명: (DumpTOP 회원만 볼 수 있음)

문제11

Dataproc クラスタにプリエンプティブワーカーを追加するときに適用されるルールはどれですか (回答を 2 つ選択してください)。

A. プリエンプティブワーカーはデータを保存できません。

B. プリエンプティブワーカーが再利用された場合は、代わりのワーカーを手動で追加する必要があります。

C. Dataproc クラスタにはプリエンプティブワーカーのみを含めることはできません。

D. プリエンプティブワーカーは永続ディスクを使用できません。

정답: A,C

설명: (DumpTOP 회원만 볼 수 있음)

문제12

会社では、履歴データを Cloud Storage にアップロードする必要があります。セキュリティルールにより、外部 IP からオンプレミスリソースへのアクセスは許可されません。最初のアップロード後、既存のオンプレミスアプリケーションから毎日新しいデータが追加されます。どうすればよいでしょうか。

A. Cloud Dataflow を使用して、データを Cloud Storage に書き込みます。

B. データ転送を実行するためのジョブテンプレートを Cloud Dataproc に記述します。

C. オンプレミスサーバーから gsutil rsync を実行します。

D. Compute Engine VM に FTP サーバーをインストールして、ファイルを受信して Cloud Storage に移動します。

정답: A

문제13

BigQuery にデータが保存されています。BigQuery データセットのデータは高可用性である必要があります。コストを最小限に抑えるこのデータの保存、バックアップ、およびリカバリ戦略を定義する必要があります。BigQuery テーブルをどのように構成すればよいでしょうか。

A. BigQuery データセットをリージョン別に設定します。スケジュールされたクエリを作成して、バックアップの時刻を末尾に付けたテーブルにデータのコピーを作成します。緊急時には、テーブルのバックアップコピーを使用します。

B. BigQuery データセットをリージョン別に設定します。緊急時には、ポイントインタイムスナップショットを使用してデータを回復します。

C. BigQuery データセットをマルチリージョンに設定します。スケジュールされたクエリを作成して、バックアップの時刻を末尾に付けたテーブルにデータのコピーを作成します。緊急時には、テーブルのバックアップコピーを使用します。

D. BigQuery データセットをマルチリージョンに設定します。緊急時には、ポイントインタイムスナップショットを使用してデータを回復します。

정답: A

최신 Professional-Data-Engineer日本語 무료덤프 - Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)

우리와 연락하기

유용한 링크

최신 업데이트