こんにちは!資格マニア2年生のどどっちです。
先日、JDLAの主催するディープラーニングG検定に一夜漬けで合格しました。
今回は資格を80個以上保有している資格マニアの私が、G検定のカンペ・チートシートを作成してみました。
「G検定にどうしても受かりたい」「役に立つカンペが欲しい」という方の、参考になれば幸いです。
- 1. はじめに
- 2. G検定カンペ・チートシート
- 2.1. 第一次AIブーム
- 2.2. 第二次AIブーム
- 2.3. 第三次AIブーム
- 2.4. オープンデータ技術
- 2.5. 探索木
- 2.6. サイクプロジェクト(Cya Project)
- 2.7. AlphaGo(アルファ碁)
- 2.8. Mini-Max法
- 2.9. モンテカルロ法
- 2.10. 人工無能
- 2.11. エキスパートシステム
- 2.12. 意味ネットワーク
- 2.13. 統計的自然言語処理
- 2.14. ニュートラルネットワーク
- 2.15. ディープラーニング
- 2.16. トイプロブレム
- 2.17. フレーム問題
- 2.18. データバイアス問題
- 2.19. No Free Lunch定理
- 2.20. チューリングテスト
- 2.21. 特徴量設計
- 2.22. シンギュラリティー
- 2.23. 教師あり学習
- 2.24. 教師なし学習
- 2.25. Q学習
- 2.26. ランダムフォレスト
- 2.27. セマンティックセグメンテーション
- 2.28. サポートベクターマシン(SVM)
- 2.29. ベイズ推定
- 2.30. ロジスティック回帰
- 2.31. ニューラルネットワーク
- 2.32. データの評価
- 2.33. 線形回帰
- 2.34. 事前学習アプローチ
- 2.35. ムーアの法則
- 2.36. 演算装置
- 2.37. 関数
- 2.38. 畳み込みニューラルネットワーク(CNN)
- 2.39. プーリング
- 2.40. RNN
- 2.41. データセット
- 2.42. 共有モデル
- 2.43. 音声認識
- 2.44. 言語認識
- 2.45. 技術
- 2.46. 自動運転
- 2.47. AI倫理・AI社会
はじめに
ディープラーニングG検定では、カンペやチートシートを利用して合格している方が多いようです。
しかし一方で、他人の作成したチートシートを利用したら合格できなかったという声もあるようです。
筆者としては、せっかく試験を受けるのであれば、勉強して正しく知識を身につけることをお勧めしています。
当記事は、会社の指示や学校の単位取得などでカンペ・チートシートを必要としている方のためのものです。
試験でのカンニングなどを助長しているわけではないため、ご注意ください。
G検定カンペ・チートシート
第一次AIブーム
- 1950〜1960年代
- 「推論」と「探索」の研究
- トイ・プロブレムしか解けないことが明らかになり、終了
第二次AIブーム
- 1980年代
- 「知識」の時代
- エキスパートシステムが作られる
第三次AIブーム
- ビッグデータが台頭
- 機械学習が実用化
- ディープラーニング(深層学習)が登場
- 特徴表現学習、ビッグデータが注目
オープンデータ技術
- セマンティックWeb…情報に意味を付け、コンピュータが自動処理する技術
探索木
- 幅優先探索…あるノードの隣を全て探索し、最短距離でゴールにたどり着く
- 深さ優先探索…行き止まりのノードまで探索を行った後、1つ手前戻る
サイクプロジェクト(Cya Project)
- 全ての一般常識をコンピュータに取り込もうとする取り組み
- 1984年開始
- 今も入力が終わっていない
- ヘビーウエイトオントロジー
AlphaGo(アルファ碁)
- 2016年…人工知能が人間に勝利(韓国棋士)
Mini-Max法
- 自分が指すときにスコアが最大になるように、戦略を立てる
- 探索を減らす手法をab法と言う
モンテカルロ法
- 仮想プレイヤーを作成してゲームを趣味レーション
- ディープラーニングと相性○
人工無能
- 特定のルールに沿って会話を機械的に処理
- 1964年にイライザ(ELIZA)が誕生
エキスパートシステム
- 1970年にマイシン(MYCIN)がスタンフォード大学で開発
- 1960年代にデンディール(DENDEAL)が開発
意味ネットワーク
- 「is-a」…〇〇は〇〇である、継承関係
- 「part-of」…〇〇は〇〇の一部である、属性
統計的自然言語処理
- 複数の単語をひとまとまりの単位で用意
- コーパス…対訳データ
ニュートラルネットワーク
- 1958年…単純パーセプトロンをアメリカの心理学者が提案
ディープラーニング
- 深層学習
- 特徴表現学習を行うアルゴリズム
- パーセプトロンの限界を誤差逆伝播学習法で克服
- 2012年…ILSVRCでトロント大学のSuperVisionが勝利
トイプロブレム
- 複雑な問題はコンピュータでは解けない問題
フレーム問題
- 1969年に提唱された問題
- 今しようとしていることに関係のあることだけを選ぶのは、難しい
データバイアス問題
- 学習データの偏りや偏見が判定に影響
No Free Lunch定理
- 機械学習の限界を数学的に証明
- みにくいアヒルの子定理…対象が持つ特徴を全て平等に評価すると識別が困難
チューリングテスト
- アランチューリングが提唱
- コンピュータだと見抜ければ知能があるものとするテスト
- ローブナーコンテストが毎年開催
- 中国語の部屋の例えが有名
- シンボルグラウンディング問題
特徴量設計
- 特徴量…注目すべきデータの特徴を量的に表す
- 特徴表現学習…特徴量を機械学習で機械が発見
シンギュラリティー
- 技術的特異点
- 人工知能が自分自身より賢い人工知能を作るようになる点
- 人間よりも賢くなる
教師あり学習
- 与えられたデータをもとにパターンを予測識別
- 教師とは出力データのこと
- 回帰問題…連続値を予測
- 分類問題…離散値を予測
- 線形回帰…データに最も当てはまる直線を考える
教師なし学習
- 出力なしの学習
- 入力データそのものが持つ特徴が対象
- k-means手法…元のデータからグループ構造を見つけ出し、まとめる
- クラスタ分析…k-meansを用いた分析のこと
- 主成分分析…多次元データに対して効果のある成分を抽出
Q学習
- 2つの価値関数を利用して、価値に基づく学習を行う
- DeepMindのDQNに応用
ランダムフォレスト
- 決定木を用いる手法
- 中身がブラックボックス化
- ブーストラップサンプリング…ランダムに学習
- ブースティング…一部のデータを繰り返し抽出
- バギング…全体から一部のデータを用いて複数のモデルで学習する手法
セマンティックセグメンテーション
- より詳細な領域分割を得るモデル
- FCN…全ての層が畳み込み層のモデル
サポートベクターマシン(SVM)
- 各でーたとの距離が最大になる境界線を求める
- マージン最大化
- 未学習データにも高い識別機能
ベイズ推定
- 確率を計算して推定
- データを増やすことで精度向上
ロジスティック回帰
- AとBどちらかしか起こらない場合などに分類できる確率を計算
- 外れ値に過剰反応
ニューラルネットワーク
- 人間の脳の構造を模したアルゴリズム
- シグモイド関数…0から1の値を取るようにする
- 活性化関数…どのように電気信号を伝えるか調整する関数
- 多層パーセプトロン…層を追加したモデル
- 隠れ層…入力層と出力層の間に追加された層
データの評価
- 考査検証…データを分割して評価
- 訓練データ…学習用のデータ
- テストデータ…評価用のデータ
- ホールドアウト検証…事前に訓練データとテストデータに分割
- k-分割考査検証…分割を複数回行い、それぞれで学習評価を行う
- F値…適合率と再現率の調和平均
- 再現率…正であるものの中で、正だと予測できた割合
線形回帰
- ラッソ回帰…L1正則化を適用した手法
- リッジ回帰…L2正則化を適用した手法
事前学習アプローチ
- オートエンコーダ…可視層と隠れ層の2層からなるネットワーク
- エンコード…入力層→隠れ層における処理
- デコード…隠れ層→出力層における処理
ムーアの法則
- 半導体の集積と性能は、18ヶ月ごとに倍になる
演算装置
- CPU…コンピュータ全般の作業を処理
- GPU…画像処理に関する演算の処理
- GPGPU…画像以外の目的での使用に最適化したGPU
- TPU…Googleの開発したテンソル計算処理最適化の演算処理装置
関数
- 誤差関数…モデルの予測値と実際の値の誤差
- 勾配降下法…勾配に沿って降りていき解を散策する手法
畳み込みニューラルネットワーク(CNN)
- 画像をそのまま2次元で入力可能なモデル
- ネオコグニトロン…2つの細胞のはたらきを最初に組み込んだモデル
- 多層構造
- LeNET…畳み込み層とプーリング層の2種類を交互に組み合わせ
- 畳み込み…フィルタを用いて画像の特徴を抽出
- Inceptionモジュール…GoogLeNetに導入
- アレックスネット…3層構造
- 転移学習…学習済のネットワークを新しいタスクに活用
プーリング
- 決められた演算を行うだけのもの
- ダウンサンプリング、サブサンプリング
- AVGプーリング…平均値を取るプーリング処理
- データ拡張…データの水増し。上下左右に反転したデータなどを使う
RNN
- 時系列データを直接入力できる
- 過去の隠れ層が追加されている
- BPTT…時間軸に沿って誤差を反映
- LSTM …隠れ層の構造を変えることで同様に問題を解決
データセット
- ImageNet…スタンフォード大学がネット上から画像を集めて分類
- DeepDrive100k…自動運転人工知能のデータセット、運転経験を撮影
- MSCOCO…マイクロソフトが作成した画像セマンティックセグメンテーション用
- MNIST…ニューヨーク大学、手書き数字を集めたデータセット
- VGGFaceDataset…オックスフォード大学がまとめた顔画像のデータセット
- TwitterUSAirlineSentiment…Twitterのデータセット
- PascalVOC…欧州のPASCALがまとめたデータセット
共有モデル
- GoogLeNet…Google開発の画像認識用ニューラルネットワークを学習したもの
- ResNet…マイクロソフト開発の152層モデル
- DeepHand…手の形を認識
- FCNs…セマンティックセグメンテーションを行う完全畳み込みネットワーク
- AlexNet…最初の頃の画像認識用ニューラルネットワークのモデル
- SegNet…セマンティックセグメンテーション用のモデル
- DeepYeast…体内細胞を認識するモデル
- PlacesCNN…写真から場所を推定するモデル
音声認識
- WaveNet…音声合成と音声認識の両者を行うことができるモデル
言語認識
- RBMT…初期の機械翻訳、人がルールを作成
- SMT…統計的機械翻訳、1980年代からIBMなどが着手
- NMT…ディープラーニングを利用したニューラル機械翻訳
- 事前トレーニング…GPT(OpenAI)、BERT(Google)、ElMo
強化学習
- 環境から報酬の最大化をするように選択する学習
- ロボット操作に使われることが多い
- セルフプレイ…0からAIが学習
- セルフプレイのアルファ碁ゼロがアルファ碁を超えた
技術
- DeepFace…2015年公開、FACEBOOK開発の顔認識システム
- アテンション機構…重要要素にマーキングを行い、重要度に応じて調整
- トランスフォーマー…注意機構を主役で利用したDNN
自動運転
- 2022年…高速でのトラック隊列商業化予定
- YOLO…2016年に発表された物体認識アルゴリズム
- Waymo…Googleの自動運転開発部門
- レベル0…運転者が全て行う
- レベル1…運転支援、車両運動のサブタスクを限定で実行
- レベル2…部分運転自動化
- レベル3…条件付運転自動化、システムが限定領域で運転する
- レベル4…高度運転自動化、システムが全てのタスクと困難な場合の応答を限定領域で実行
- レベル5…完全運転自動化、システムが全て行う
AI倫理・AI社会
- プライバシーバイデザイン…あらかじめプライバシーに配慮した設計
- Society5.0…日本の未来社会構想
- AI-Ready…日本の掲げるAI社会像
- スーパーシティ構想…先進的なAIシティを政府が提案、未来社会を追求
- 説明可能なAI…説明可能性について検証する必要がある