一般社団法人データサイエンティスト協会は4月21日10時から、2022年度春の「データサイエンティスト検定 リテラシーレベル(DS検定)」の受験申し込みを開始したと発表した。全国各地の試験会場で受験でき、試験実施期間は6月10日〜6月30日を予定している。
今回で2回目の実施 一部試験範囲に変更あり
「データサイエンティスト検定 リテラシーレベル」は、アシスタント・データサイエンティスト(見習いレベル:★)と数理・データサイエンス教育強化拠点コンソーシアムが公開している数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムを統合し、実務能力と知識を有することを証明する試験だ。
データサイエンス初学者やこれからデータサイエンティストを目指すビジネスパーソン、データサイエンティストに興味を持つ大学生や専門学校生などを対象としている。2021年秋に続き、今回で2回目の試験実施となる。
本資格の取得により、データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力についてそれぞれ見習いレベルの実務能力や知識、また、数理・データサイエンス・AI教育のリテラシーレベルの実力を有していることを証明できる。
検定の概要は以下のとおり。
- 試験期間:2022年6月10日(金)〜2022年6月30日(木)
- 申し込み期間:個人申し込み 2022年4月21日(木)10:00〜2022年5月31日(火)23:59
法人申し込み 2022年4月21日(木)10:00〜2022年5月20日(金)18:00 - 申し込み方法:個人申し込みはこちらから
法人申し込みはこちらから - 受験資格:なし
- 実施概要:全国の試験会場で開催(CBT)
四肢択一式90問90分 - 出題範囲:2021年に更新したスキルチェックリストver.4に基づき、一部試験範囲に変更あり ※詳細は【データサイエンティスト検定の試験範囲】を参照
- 結果発表:2022年7月下旬予定
- 受験費用(税抜):一般 10000円、学生 5000円
DS協会によると、前回(2021年実施)は約1400名が受験し、合格者数は927名。正答率約80%が合格ラインの目安だったという。
試験範囲
試験範囲は以下のとおり。
DS検定公式サイトで準備されている模擬問題はこちら。
- データサイエンス力★1:統計数理基礎、線形代数基礎、微分・積分基礎、集合論基礎、統計情報への正しい理解、データ確認、俯瞰・メタ思考、データ理解、洞察、回帰・分類、評価、推定・検定、グルーピング、性質・関係性の把握、因果推論、サンプリング、データクレンジング、データ加工、特徴量エンジニアリング、方向性定義、軸だし、データ加工、表現・実装技法、意味抽出、時系列分析、機械学習、深層学習、自然言語処理、画像認識、映像認識、音声認識、パターン発見
- データエンジニアリング力★1:システム企画、システム設計、アーキテクチャ設計、クライアント技術、通信技術、データ抽出、データ収集、データ構造の基礎知識、テーブル定義、DWH、分散技術、クラウド、フィルタリング処理、ソート処理、結合処理、前処理、マッピング処理、サンプリング処理、集計処理、変換・演算処理、データ出力、データ展開、データ連携、基礎プログラミング、拡張プログラミング、アルゴリズム、分析プログラム、SQL、ITセキュリティの基礎知識、攻撃と防御手法、暗号化技術、認証、ソース管理、AutoML、MLOps、AIOps
- ビジネス力★1:ビジネスマインド、データ・AI倫理、コンプライアンス、契約、MECE、構造化能力、言語化能力、ストーリーライン、ドキュメンテーション、説明能力、AI活用検討、KPI、スコーピング、データ入手、分析アプローチ設計、データ理解、意味合いの抽出・洞察、評価・改善の仕組み、プロジェクト発足、リソースマネジメント、リスクマネジメント
- リテラシーレベル:モデルカリキュラム〈スキルセット〉
1.社会におけるデータ・AI利活用- 1-1.社会で起きている変化
- ビッグデータ、IoT、AI、ロボット
- データ量の増加、計算機の処理性能の向上、AIの非連続的進化
- 第4次産業革命、Society 5.0、データ駆動型社会
- 1-2.社会で活用されているデータ
- 調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
- 1次データ、2次データ、データのメタ化
- 構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
- データ作成(ビッグデータとアノテーション)
- データのオープン化(オープンデータ)
- 1-3.データ・AIの活用領域
- データ・AI活用領域の広がり(生産、消費、文化活動など)
- 研究開発、調達、製造、物流、販売、マーケティング、サービスなど
- 仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
- 1-4.データ・AI利活用のための技術
- データ解析:予測、グルーピング
- データ可視化:関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など
- 非構造化データ処理:言語処理
- 1-5.データ・AI利活用の現場
- 流通、製造、金融、サービス、インフラ、公共、ヘルスケアなどにおけるデータ・AI利活用事例紹介
- 1-6.データ・AI利活用の最新動向
- AIなどを活用した新しいビジネスモデル(シェアリングエコノミー、商品のレコメンデーションなど)
- AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など)
2.データリテラシー
- 2-1.データを読む
- データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
- 観測データに含まれる誤差の扱い
- 相関と因果(相関係数、擬似相関、交絡)
- 母集団と標本抽出(国勢調査、アンケート調査、全数調査、単純無作為抽出、層別抽出、多段抽出)
- 統計情報の正しい理解(誇張表現に惑わされない)
- 2-2.データを説明する
- データの図表表現(チャート化)
- データの比較(条件をそろえた比較、処理の前後での比較、A/Bテスト)
- 不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)
- 優れた可視化事例の紹介(可視化することによって新たな気づきがあった事例など)
- 2-3.データを扱う
- データの集計(和、平均)
3.データ・AI利活用における留意事項
- 3-1.データ・AIを扱う上での留意事項
- 個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト
- 1-1.社会で起きている変化
>>データサイエンティスト検定 リテラシーレベル|一般社団法人 データサイエンティスト協会
(編集部注※本文中に誤りがあったため、記事の一部を修正しました 2022年5月14日 14:19)