AIQuestに応募しました

GoogleのDiscoverで経産省が実施するAI人材育成事業「AIQuest」というのを見つけ、登録することにしました。

AIQuestとは

実施内容は、「課題解決型学習(Project Based Learning、PBL)」と「企業とAI人材の協働」の2つで、前者で実データをもとにモデルづくりと実装を行い、後者は実際の中小企業と組んで企業のデータを使ってAIの実導入を目指すというもの。

基本、無料で受講(所要時間は週6時間程度で4〜5ヶ月間)できるようですが、対象者の応募理由や技術レベルなどを元に選考が行われる模様。登録画面での入力内容はせいぜい数百字ですが、AI技術レベルのアセスメントがあり、登録後にアクセスするサイトからデータセットを取得、モデルの構築を行い、結果を提出する必要があります。説明によれば、3〜6時間程度の問題ということですが、前提知識の有無によって相当、時間幅があるような気がします。

とりあえずモデルを作る

私もまず最初はシンプルに線型回帰でモデルを作りはじめましたが、その前にデータセットの加工が地味に手間がかかります。あまりなれていないPythonでのデータ加工なので、すべての項目を使うのでなく、手間がかかりそうなものは一旦捨てて、データを仕上げました。

結果は、

線型回帰 (R2決定係数
Training score:0.438 Test score:0.448
リッジ線型回帰
Training score:0.430 Test score:0.441  です。


0.4程度しかなく、無理やり当てはめました感が強いというところです。
そこで、他の回帰モデルを探していると、モデルを自動で選んでくれ、さらにハイパーパラメータのチューニングやサンプルデータへの適用までやってくるPyCaretというAutoML(Automated Machine Learning)を見つけました。今こんなものまであるのかと。 そこで早速これで再計算すると、

PyCaretによるモデル比較結果

lightgbmという回帰モデルが一番良い結果(R2で0.5691)のようでしたので、これを元に回答用サンプルケースに適用して、提出データをつくりました。

アセスメントデータ提出

機械学習自体はあっさりしたもので、初回のデータ提出時はどきどきしましたがそこそこの順位の44位でしたので、AutoMLをつかうのがやはり効率的という印象です。なお、現在はデータ提出が増えて59位(380人中)にまで落ちていますが、100位以下になったら、少し元データに手を入れようかと思います。

IT,経営AI,IT,機械学習

Posted by 8000s