최신 DP-100日本語 무료덤프 - Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版)

ホットスポットに関する質問
Azure Machine Learning ワークスペースを作成します。Azure Machine Learning Python SDK v2 を使用してコンピューティング クラスターを作成します。
コンピューティング クラスターはトレーニング スクリプトを実行する必要があります。トレーニング スクリプトの実行に関連するコストは最小限に抑える必要があります。
コンピューティング クラスターを作成するには、Python スクリプトを完了する必要があります。
スクリプトをどのように完成させるべきですか? 回答するには、回答エリアで適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
정답:
注: この質問は、同じシナリオを提示する一連の質問の一部です。一連の質問にはそれぞれ、定められた目標を満たす独自の解決策が含まれています。質問セットによっては、正しい解決策が複数ある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答した後は、その質問に戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
Azure Machine Learning モデルをトレーニングして登録します。
モデルをオンライン エンドポイントにデプロイする予定です。
アプリケーションが、有効期限のないアーティファクトを使用した認証方法を使用してモデルにアクセスできるようにする必要があります。
解決策: デフォルトの認証設定を使用して、管理されたオンライン エンドポイントを作成します。モデルをオンライン エンドポイントにデプロイします。
ソリューションは目標を満たしていますか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、述べられた目標を達成する可能性のある独自の解決策が含まれています。一部の質問セットには複数の正しい解決策がある場合がありますが、他の質問セットには正しい解決策がない場合があります。
このセクションの質問に回答した後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
ロジスティック回帰アルゴリズムを使用して分類モデルをトレーニングします。
各機能の重要度を、全体的なグローバル相対重要度値として、および特定の予測セットのローカル重要度の尺度として計算することにより、モデルの予測を説明できる必要があります。
必要なグローバルおよびローカルの特徴重要度値を取得するために使用できる説明を作成する必要があります。
解決策:MimicExplainerを作成します。
ソリューションは目標を達成していますか?

정답: B
설명: (DumpTOP 회원만 볼 수 있음)
注: この質問は、同じシナリオを提示する一連の質問の一部です。一連の質問にはそれぞれ、定められた目標を満たす独自の解決策が含まれています。質問セットによっては、正しい解決策が複数ある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答した後は、その質問に戻ることはできません。そのため、これらの質問はレビュー画面に表示されません。
ワークスペースに Azure Machine Learning サービス データストアを作成します。データストアには次のファイルが含まれます。
2018年第1四半期
2018年第2四半期
2018年第3四半期
2018年第4四半期
2019年第1四半期
すべてのファイルは、次の形式でデータを保存します。
id、f1、f2、I
1,1,2,0
2、1、1、1
3,2,1,0
4,2,2,1
次のコードを実行します。

次のコードを使用して、training_data という名前のデータセットを作成し、すべてのファイルからデータを 1 つのデータ フレームにロードする必要があります。

解決策: 次のコードを実行します。

ソリューションは目標を満たしていますか?

정답: B
설명: (DumpTOP 회원만 볼 수 있음)
WS1 という名前の Azure Machine Learning ワークスペースがあります。
Responsible AI ダッシュボードを使用して、WS1 に登録する MLflow モデルを評価する予定です。
MLflow モデルを登録するために使用するライブラリを特定する必要があります。
どのライブラリを使用すればよいですか?

정답: C
설명: (DumpTOP 회원만 볼 수 있음)
モデル開発戦略を実装して、ユーザーが広告に反応する傾向を判断する必要があります。
どのテクニックを使用する必要がありますか?

정답: D
설명: (DumpTOP 회원만 볼 수 있음)
ホットスポットに関する質問
Azure Machine Learning の Hyperdrive 機能を使用してモデルをトレーニングしています。
次のコードを実行して、Hyperdrive 実験を構成します。

次の各文について、正しい場合は「はい」を選択してください。そうでない場合は「いいえ」を選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
정답:

Explanation:
Box 1: Yes
In random sampling, hyperparameter values are randomly selected from the defined search space. Random sampling allows the search space to include both discrete and continuous hyperparameters.
Box 2: Yes
learning_rate has a normal distribution with mean value 10 and a standard deviation of 3.
Box 3: No
keep_probability has a uniform distribution with a minimum value of 0.05 and a maximum value of
0.1.
Box 4: No
number_of_hidden_layers takes on one of the values [3, 4, 5].
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
パイプラインのステップを定義するには、次のコードを使用します。
azureml.core からワークスペース、実験、実行をインポートします
azureml.pipeline.core からパイプラインをインポートします
azureml.pipeline.steps から PythonScriptStep をインポートします
ws = ワークスペース.from_config()
. . .
ステップ1 = PythonScriptStep(名前="step1", ...)
ステップ2 = PythonScriptsStep(名前="step2", ...)
パイプラインステップ = [ステップ1、ステップ2]
手順を実行するにはコードを追加する必要があります。
この目標を達成するために使用できる 2 つのコード セグメントはどれですか。それぞれの正解は完全なソリューションを示します。
注意: 正しい選択ごとに 1 ポイントが付与されます。
実験 = 実験(ワークスペース=ws,

정답: A,C
설명: (DumpTOP 회원만 볼 수 있음)
次のコードがあります。このコードは、スクリプトを実行するための実験を準備します。

実験は、デフォルトの環境を使用してローカルコンピューターで実行する必要があります。
実験を開始してスクリプトを実行するには、コードを追加する必要があります。
どのコードセグメントを使用する必要がありますか?

정답: B
설명: (DumpTOP 회원만 볼 수 있음)
ホットスポットに関する質問
近くの気象観測所からデータを収集します。
次のデータを含む weather_df という名前の pandas データフレームがあります。

データは正午と深夜の 12 時間ごとに収集されます。
自動化された機械学習を使用して、今後 7 日間の気温を予測する時系列モデルを作成する予定です。トレーニングの最初のラウンドでは、最大 50 個の異なるモデルをトレーニングします。
これらのモデルをトレーニングするには、Azure Machine Learning SDK を使用して自動化された機械学習実験を実行する必要があります。
自動化された機械学習の実行を構成する必要があります。
AutoMLConfig 定義をどのように完了すればよいですか? 回答するには、回答領域で適切なオプションを選択してください。
注意: 正しい選択ごとに 1 ポイントが付与されます。
정답:

Explanation:
Box 1: forcasting
Task: The type of task to run. Values can be 'classification', 'regression', or 'forecasting' depending on the type of automated ML problem to solve.
Box 2: temperature
The training data to be used within the experiment. It should contain both training features and a label column (optionally a sample weights column).
Box 3: observation_time
time_column_name: The name of the time column. This parameter is required when forecasting to specify the datetime column in the input data used for building the time series and inferring its frequency. This setting is being deprecated. Please use forecasting_parameters instead.
Box 4: 7
"predicts temperature over the next seven days"
max_horizon: The desired maximum forecast horizon in units of time-series frequency. The default value is 1.
Units are based on the time interval of your training data, e.g., monthly, weekly that the forecaster should predict out. When task type is forecasting, this parameter is required.
Box 5: 50
"For the initial round of training, you want to train a maximum of 50 different models." Iterations: The total number of different algorithm and parameter combinations to test during an automated ML experiment.
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-train-automl-client/ azureml.train.automl.automlconfig.automlconfig
地元のタクシー会社の履歴データを含むデータセットを分析しています。回帰モデルを開発しています。
タクシー料金を予測する必要があります。
回帰モデルを正しく評価するには、パフォーマンス メトリックを選択する必要があります。どの 2 つのメトリックを使用できますか? それぞれの正解は完全なソリューションを示します。
注意: 正しい選択ごとに 1 ポイントが付与されます。

정답: C,F
Azure Machine Learning ワークスペースで自動化された機械学習実験を実行します。
実行に関する情報は以下の表に記載されています。

Azure Machine Learning SDK を使用して、実験実行の最適な反復を取得するスクリプトを記述する必要があります。
どの Python コード セグメントを使用すべきでしょうか?

정답: C
설명: (DumpTOP 회원만 볼 수 있음)
GPUベースのトレーニングを使用して、Azure Machine Learningサービスで画像認識のためのディープラーニングモデルを作成します。
リアルタイムのGPUベースの推論を可能にするコンテキストにモデルをデプロイする必要があります。
モデル推論のためにコンピューティングリソースを構成する必要があります。
どの計算タイプを使用する必要がありますか?

정답: D
설명: (DumpTOP 회원만 볼 수 있음)
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正しい解決策がある場合もあれば、正しい解決策がない場合もあります。
このセクションの質問に回答すると、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Azure Machine Learning Studioで新しい実験を作成しています。
1つのクラスには、トレーニングセットの他のクラスよりもはるかに少ない数の観測値があります。
クラスの不均衡を補うために、適切なデータサンプリング戦略を選択する必要があります。
解決策:Scale and Reduceサンプリングモードを使用します。
ソリューションは目標を達成していますか?

정답: B
설명: (DumpTOP 회원만 볼 수 있음)
Workspase1 という名前の Azure Machine Learning ワークスペースと Share1 という名前の Azure Files 共有を管理します。
Share1 をターゲットとする Azure Files データストアを Workspace1 に作成する予定です。
Azure Files データストアから Share1 への永続的なアクセスを構成する必要があります。
どの認証方法を使用すればよいですか?

정답: C
ノートブックからのモデル トレーニングのハイパーパラメータ チューニングを実装しています。ノートブックは、Azure Machine Learning ワークスペース内にあります。
num_hidden_​​layers および batch_size ハイパーパラメータの検索空間に対してグリッド サンプリング メソッドを構成する必要があります。
グリッド サンプリングのハイパーパラメータを特定する必要があります。
どのハイパーパラメータ サンプリング アプローチを使用すべきですか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
Azure Machine Learning スタジオを使用してデータをプロファイリングしています。
奇数または欠損値のある列を検出する必要があります。
どの統計を分析する必要がありますか?

정답: C
ホットスポットに関する質問
10,000 個のデータ ポイントと 150 個の機能を持つ正規化された数値機能セットを含む、マルチクラス分類タスク用に作成されたデータセットがあります。
データ ポイントの 75% をトレーニングに使用し、25% をテストに使用します。Python では scikit-learn 機械学習ライブラリを使用しています。X を使用して機能セットを示し、Y を使用してクラス ラベルを示します。
次の Python データ フレームを作成します。

主成分分析 (PCA) 手法を適用して、トレーニング セットとテスト セットの両方で特徴セットの次元を 10 個に減らす必要があります。
コード セグメントをどのように完了する必要がありますか? 回答するには、回答領域で適切なオプションを選択します。
注意: 正しい選択ごとに 1 ポイントが付与されます。
정답:

Explanation:
Box 1: PCA(n_components = 10)
Need to reduce the dimensionality of the feature set to 10 features in both training and testing sets.
Example:
from sklearn.decomposition import PCA
pca = PCA(n_components=2) ;2 dimensions
principalComponents = pca.fit_transform(x)
Box 2: pca
fit_transform(X[, y])fits the model with X and apply the dimensionality reduction on X.
Box 3: transform(x_test)
transform(X) applies dimensionality reduction to X.
References:
https://scikit-learn.org/stable/modules/generated/sklearn.decomposition.PCA.html
差分プライバシーのイプシロンとデルタの値に基づいて、個人情報が漏洩する潜在的なリスクを評価する必要があります。プライバシー レポートを作成します。
1 より大きいイプシロン値は何を表しますか?

정답: C
설명: (DumpTOP 회원만 볼 수 있음)
バイナリ分類モデルを作成します。
モデルの公平性を評価するには、Fairlearn パッケージを使用します。
モデルを再トレーニングする必要性をなくす必要があります。
Fairlearn パッケージを実装する必要があります。
どのアルゴリズムを使用すべきでしょうか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)

우리와 연락하기

문의할 점이 있으시면 메일을 보내오세요. 12시간이내에 답장드리도록 하고 있습니다.

근무시간: ( UTC+9 ) 9:00-24:00
월요일~토요일

서포트: 바로 연락하기