金沢工業大学 夢考房 データサイエンスプロジェクト Data Dreamers 紹介資料
Data Dreamersとは 夢考房に所属する課外活動団体 Data Dreamers は夢考房所属のプロジェクト組織 → 正式名称は「夢考房データサイエンスプロジェクト Data Dreamers」 2023年春に研究夢考房「Start Up Project」という枠組みで発足 2024年春に夢考房プロジェクトへと昇格
Data Dreamersの活動目的 学内におけるデータ分析に関するプロジェクトの構築 1. データ分析を扱う技術向上の機会を得られる場の構築 2. オープン・クローズドな実データを扱った社会課題の解決 この二つのテーマを軸にした活動を通じて 社会課題を解決できるデータサイエンティスト の育成を目指す
データサイエンティストとは データ分析を通じて新たな価値を創出する仕事 高度に情報化された社会において、日々複雑化及び増大化(ビッグデータ化)するデータを、利用 者の利用目的に応じて情報を収集・分析する技術を有し、ビジネスにおいて実行可能な情報を作 ることができる者をいう。 (データサイエンティスト協会定款第2条より) データサイエンティストに求められる三つのスキル
プロジェクトの育成方針 三つのスキルをバランスよく鍛えることを目指す ビジネス力 • マナビDXクエストなどの企業協働&チームマネジメントで身に付ける • 企業との連携によって実務に即したビジネス力を身に着ける データエンジニアリング力・データサイエンス力 • コンペティションやハッカソン、GCI等への参加で身に付ける • 同じ目標を持つ仲間と学ぶことによって得られる相乗効果 データサイエンティストとしてのビジョンの明確化 • 先輩による内定者交流会を通じて就活時のノウハウを共有 • OBによる交流会を通じて将来のビジョンを明確化する
活動時間・場所 様々な場所で活動を実施 活動時間 コアタイム: 月曜 17:00~19:00 コアタイム外の活動時間は自由 活動場所 ・夢考房 2F ・Challenge Lab 2F ・教室 ・オンライン(Discord)
活動内容 コンペティションや コンテストへの参加 データ分析関連の イベントに参加 先輩・OBによる ノウハウの共有
プロジェクト組織構成 グループ活動により専門性を高める 学部2年: 38名 学部3年: 36名 学部4年: 21名 修士1年: 6名 修士2年: 4名 博士3年: 1名 計106名 顧問: 情報デザイン学部 環境デザイン創成学科 狩野剛 准教授 副顧問: 情報理工学部 知能情報システム学科 山本知仁 教授
活動の流れ 個々のニーズに応じた柔軟な活動を実施 定期活動 プ ロ ジ ェ ク ト 加 入 行政・オープンデー タ 新 入 生 教 育 スポーツデータ 金融データ アプリ開発 マルチモーダル LLM コンペ参加 不定期活動 ハッカソン等のイベントにはグループの垣根 を越えて参加
活動方法 Discordとnotionを活用して活動を実施 ● コンペ等のイベント情報や技術系記事などの共有にはDiscordを使用 ● イベント管理や進捗状況の共有などにはnotionを使用 → 情報の共有と参加者の可視化によって参加障壁を軽減
グループ選び 興味・関心のある分野に分かれて活動を実施 長期グループ 行政・オープンデータ 短期グループ データ分析・施策立案 金融データ 予測モデル・システム開発 スポーツデータ スポーツ系イベントの参加 LLM LLMアプリ開発・勉強会 アプリ開発 Webアプリ開発・運用 マルチモーダル AIシステム開発・勉強会 コンペ参加 コンペA コンペB コンペC コンペ等のイベントごとに プロジェクトを形成する
行政・オープンデータグループ データを収集・解釈・検証し、課題の解決に取り組む 昨年参加したコンテスト 主な活動 ・オープンデータ※1を可視化 (使用ツール:Tableau、Python) ・行政主催のデータコンテスト への参加 ※1主に国や地方公共団体が公開している 誰もが「二次利用可能」なデータ 「〇〇市 統計情報」 で検索🔎 「地方創生★政策アイデアコンテスト」 →自由に地域を選定して課題を見つけ、 分析し、解決策をスライドにして 提出 「学生データ分析AWARD」 →社会課題について取り上げ、 オープンデータを活用して解決策を 提案、発表
金融データグループ 金融データの解析・可視化・システム化に取り組む 活動内容と特色 参加した大会 現在取り組んでいること ・株の自動売買シミュレーション ・仮想通貨の自動売買シミュレーション ・有価証券報告書※1の可視化アプリ作成 (使用ツール:Jupyter Lab、Python) 第3回金融データ活用チャレンジ 金融データの解析に取り組むグループ 時系列データの知識を身につけたい人向け 実践形式で学ぶ ※1有価証券報告書:株式を発行する企業が、自社の事業や財務状況を 公表する書類 →生成AIを活用して企業のESGレポートや 統 合報告書に関連する質問に回答 Engineer Guild Hackathon →8人のチームで自動情報収集アプリの作成
スポーツデータグループ トラッキングデータを用いたデータ分析&コンペ参加 主な活動 コンペ参加 ・サッカーに関するトラッキングデータを用 い、基本的なデータ分析について学習 (使用ツール:Jupyter Lab、Python) ・与えられたデータを使ってチームで分析 テーマを決定し、データ分析。ポスター発表 から報告書作成まで行う。 ・高校のサッカー部と連携して活動 データの可視化→データ分析 →ポスター発表→報告書作成 ・日本統計学会スポーツデータサイエンス分 科会主催のコンペに参加
LLMグループ 大規模言語モデルについて学び、活用する ● ● 大規模言語モデル(LLM)について学び、オリジナルのアプリを開発 自然言語処理や大規模言語モデルに関心がある人向け
アプリ開発グループ 実務レベルのモダンなアプリケーションの実装 & 運用 プロジェクト内で独自のデータを収集 し,分析するための基盤を作成 運用して得たデータを分析し,AIや機械学習に応用するチーム 活動内容 ● ● 得られる技術 データサイエンス学習管理システムの開発 ● アプリ開発の手法や技術への知見 python,データ分析を体系的に学べるシステムを作成データ ● 運用・保守を見据えた開発体制 から個々の学習状況やスキルを分析 ● UI / UX を意識したサービス創出 オフィシャルサイトの開発・運用 ● データ収集へのアプローチ 内外問わずData Dreamersの活動内容の周知を行う ● インフラ基盤技術への理解 アクセス数分析やSEO改善, デザイン改善など
マルチモーダルグループ AIモデルの実装とWebシステムへの統合 取り扱うAIモデル 活動内容 ● ● ● 画像モデル( Vision) 様々なサービスに活用するためのAIモデルを ● 音声モデル( Audio) 独自開発している。 ● 言語モデル( Language) AIモデルを組み込んだ中長期開発 ● 生成モデル( Generation AI) AIモデルの実装 実装されたAIモデルを活用した新規サービスの 開発を実施。 ● AIモデルに関する勉強会 AIの基礎から応用まで体系的に学ぶ。 例> 3次元物体認識 例> テキストから画像生成
コンペ参加グループ データ分析に関する総合力を養う 参加したコンペティション 活動内容 ● チームでKaggle・SIGNATEで開催されているコ ンペティションへ参加 (※ コンペごとにチームを形成し、終了後解散) 第2回NEXCO東日本 渋滞予測チャレンジコンテスト ➢ 第1回 国土交通省 地理空間情報データチャレンジ ➢ ● コアタイムを実施 → 1週間の進捗共有と 上級生(大学院生・学部3、4年生)から のフィードバック 交通量・ルート検索履歴のデータを用いて、高速道路にお ける渋滞の有無を予測するモデルを構築 国土数値情報や民間企業のデータを活用し、不動産の賃 料の予測モデルを構築 Rohlik Sales Forecasting Chalenge ➢ 過去の倉庫在庫の売上データを使用し、未来14 日間の選 択された倉庫在庫の売上を予測するモデルを構築
内定者交流会 OB・先輩との交流会を通じて知見を広げる ● 内定が決まった先輩方から、就活ノウハウや大学生活でどのような 行動を起こし、それがどのような成果に結びついたかなどを共有する ● 交流会の様子はアーカイブ化しており、いつでも見れるように整備 増田さん(NEC) 藤田さん(ソニー) 坂内さん(ソフトバンク)
就職実績 24卒~26卒の先輩たちの就職先 24卒 25卒 ×2 26卒
活動実績 これまでの主な活動実績について記載 2023年度 • GCI2023Summer(修了1名) • マナビDXクエスト(Gold修了2名) • Azure OpenAI Serviceハッカソン(優勝) 2024年度 • 第2回NEXCO東日本 渋滞チャレンジ予測コンテスト(メダル獲得7名) • Axell AI Contest(26位入賞) • 学生データ分析AWARD2024(3位入賞) • 第1回国土交通省 地理空間情報データチャレンジ(メダル獲得1名) • 第3回金融データ活用チャレンジ(メダル獲得2名)
さいごに 昨日より良い明日をデータサイエンスで ● Data Dreamersは社会課題を解決できるデータサイエンティストを一人でも多く 社会に送り込むことを目指している ● Data Dreamersに加入したすべての人々に「入ってよかった」と思ってもらいた い ● Data Dreamers出身メンバーたちでデータサイエンスの力で社会を変革させる