こんにちは!YOUTRUSTでデータエンジニアをしている小林(YOUTRUST)です。今年の7月に入社して約1ヶ月が経ちました。今回のブログでは、入社してから1ヶ月間で生成AIを活用してYOUTRUSTのデータ基盤のキャッチアップをしたことについて書いてみようと思います。
以前のブログでも紹介されていますが、YOUTRUSTではClaude CodeやDevinなどの生成AIによる開発ツールが盛んに活用されています。
Claude Code×Obsidianで作るナレッジベース開発環境 - YOUTRUST Tech Blog
生成AIを活用したデータ基盤のキャッチアップ
入社後、どのように生成AIを活用してデータ基盤のキャッチアップや業務に取り組んでいるのかを紹介していきます!
入社前の面談などでデータ基盤の概要は把握していましたが、実際のテーブルや具体的なデータ構造までは分かっていませんでした。そこで役立ったのが生成AIツール(主にClaude Code)です。おかげでスムーズにキャッチアップできていると思います!
クエリの実装やdbtモデルの開発
YOUTRUSTでは、BigQueryとdbt Cloudを用いて分析環境を整備しています。
YOUTRUSTでdbtを導入した話|ikki / stable株式会社
dbtモデルのリポジトリには、CLAUDE.mdやBigQueryのスキーマに関するドキュメントが用意されています。リポジトリをクローンしてClaude Codeで参照してもらうことで、必要な知識を与えることができます。また、dbtモデルのクエリファイルやモデルのDescriptionを書いたYAMLファイルも参照してくれるので、分析や新しいモデルのクエリの実装がしやすいです。

また、dbtモデルのリポジトリに対するプルリクエストのレビューもClaude Codeを活用して行うことができます。CLAUDE.mdにレビュー出力フォーマットが記載されているので、それに沿ったレビューコメントを出力してくれます。CLAUDE.mdには下記のような内容が書いてあります。
### レビュー出力フォーマット 以下の形式で構造化されたレビューを出力してください: - **[総合評価]**: X/10点 - **[概要]**: 変更の目的と全体像 - **[dbt実行結果]**: サンドボックス環境でのrun/test結果 - **[重大な指摘事項]**: データ品質・パフォーマンス・設計の問題(-2~-3点/件) - **[軽微な改善提案]**: SQLスタイル・命名規則・構成の改善(-0.5~-1点/件) - **[良い実装]**: 称賛すべき点、学習価値のある実装 - **[影響範囲]**: 変更されるモデルと下流への影響 - **[リスク・不確実性]**: 潜在的な問題・運用上の懸念 - **[人間が最終確認すべき観点]**: ビジネスロジック・データ定義の妥当性

もちろん、人間の目でプルリクエストの内容は確認しますが、Claude Codeを活用して効率的なモデル開発ができるようになっています!
仕様の調査
BigQueryに連携されているデータはYOUTRUSTアプリのデータやログです。クエリを実装してデータを確認する際に、アプリの仕様を調べる必要がある場面が出てきます。そのときに活用しているのがDevinです。
YOUTRUSTでは、SlackにDevinへ質問できるチャンネルが存在しているので、そこで調査を依頼することが多いです。

このチャンネルでは、エンジニアだけでなくプロダクトマネージャー(PdM)やマーケティング部のメンバーなどのビジネスサイドの方も分析のクエリ実装でDevinを活用しています。
おわりに
この記事では、入社1ヶ月のデータエンジニアが生成AIツールを活用してデータ基盤のキャッチアップをした内容を紹介しました。まだ分からないことも多いですが、ClaudeやDevinなどの生成AIツールを活用し、データエンジニアとして分析のしやすいデータ基盤の整備を進めていきたいです!