zenncast

こんにちは、マイクです！今日は2024年12月29日、土曜日ですね。今日も「zenncast」にお越しいただき、ありがとうございます！今日は、Zennでトレンドの記事をいくつかご紹介していきます。

さて、前回紹介した記事については、特にお話しすることはありませんので、さっそく今日の内容に移りましょう！

まず、今日ご紹介する記事の本数は5本です。それでは、最初の記事からいきましょう！

1つ目の記事は「2025年はRAGの次にAIエージェントが来る」です。

2024年、AIの領域では「RAG」の評価が進み、その限界が明らかになりました。この状況を受けて、次のステップとして「AIエージェント」が注目されています。AIエージェントは、特定の目標に基づいて自律的にタスクを遂行するAIシステムです。例えば、会議の日程調整や商品推薦、工場の保守管理など、さまざまな用途があります。

AIエージェントの特徴は、目標に対して必要なタスクを自律的に選択・実行できることです。これにより、ユーザーは細かな指示を出さなくても、目標達成に向けた行動をAIに任せられます。さらに、マルチエージェントシステムでは、複数のエージェントが協力し合い、専門的な仕事を効率よく遂行することが可能です。

しかし、AIエージェントにはコミュニケーションの効率性や信頼性の確保といった課題も存在します。これらの問題に対処するためには、ヒューマンインザループのアプローチが重要です。2025年には、AIエージェントとマルチエージェントの技術が進化し、AI界隈に大きな影響を与えることが期待されています。各社が開発中のフレームワークは日々進化しており、今後の展開に目が離せませんね。

。...。...。...

2つ目の記事は「LLMのコード能力を向上させる取り組み」です。

この記事では、東京科学大学の藤井氏がLlama-3.1-Swallow-8B-v0.2の開発背景と、LLM（大規模言語モデル）のコーディング能力向上に関する取り組みを解説しています。特に、swallow-code-v0.1というコードデータセットが、The Stack v2からのフィルタリングを経て開発されたことに焦点を当てています。このデータセットは、LLMの分析やコーディング能力向上に役立つように設計されています。

Llama-3.1-Swallow-8B-v0.2は、前バージョンからの改良があり、日本語の割合が増加し、特にNIILCやJHumanEvalにおいて性能が向上しています。これにより、日本語タスクにおけるコーディング能力が向上していることが示されています。

また、関連研究としてMeta社のLlama-3やQwen-2.5 Coderのデータ収集手法が紹介されており、品質管理の重要性が強調されています。Swallow Projectではフィルタリングを4段階に分けて行い、高品質なPythonコードデータを確保しました。最終的にはモデルのコーディング能力の向上が確認されています。

今後もSwallow Projectでは、LLMのReasoning能力の向上を目指し、数学やコーディング能力の強化に取り組む意向が示されており、ローカル環境でのLLMの利用に対する需要も考慮されています。

。...。...。...

3つ目の記事は「delyのデータ基盤を連邦制ガバナンスを採用したデータ基盤として刷新しています」です。

dely株式会社では、データ基盤を連邦制ガバナンスを採用して刷新中です。この取り組みの目的は、プロダクトごとのデータ基盤を論理的に統合し、全社的なデータ基盤として機能させることです。データガバナンスやセキュリティを統一し、データサイロを解消、横断的な分析環境を提供することを目指しています。

技術的には、Snowflakeをベースにしたデータ基盤を構築し、全社の分析ワークロードを管理する「全社データ分析基盤」を設けます。これにより、データを中央集権的に管理しつつ、アドホックな分析と定型分析の両方を支援する構造を実現します。

delyの課題として、データのサイロ化や迅速な意思決定を求める文化の中でのデータ品質のトレードオフがあります。今後は、dbtを活用し、非エンジニアでもデータモデルを作成できる体制を整える予定です。

。...。...。...

4つ目の記事は「browser-useの基礎理解」です。

browser-useは、Pythonで開発されたライブラリで、AIエージェントがウェブブラウザを操作するための機能を提供します。主な機能としては、DOM解析やスクリーンショット取得、マルチタブ管理、カスタムアクションの定義などがあります。

使い方としては、まずpipを使用してインストールし、APIキーを設定する必要があります。基本的な実行例として、Googleで天気予報を調べるタスクをAIエージェントに指示するコードが示されています。この際、`Agent`がユーザーの指示を受け取り、必要な操作手順を計画し、実行します。

このライブラリを活用することで、ブラウザ操作を自動化し、高度な情報収集やデータ処理を行うことが可能です。エンジニアにとっては多様な用途が見込まれるツールですね。

。...。...。...

5つ目の記事は「2024年ビッグテックのAI Agent 動向まとめ」です。

2023年に入ってから、AIエージェントの進化が加速しており、多くのビッグテック企業がこの分野に注力しています。特に、IBMとMicrosoftが発表したサーベイ論文を基に、Google、AWS、Microsoft、OpenAI、Anthropicのエージェント動向について整理しました。

各社の動向として、GoogleはNotebookLMなどのサービスを展開し、独自のチャットボットを構築可能にしています。AWSはAmazon Bedrockを用いたエージェントの構築を支援するサービスを提供し、MicrosoftはCopilotを通じてエージェントの概念を導入しています。

これらの動向は、AIエージェントの機能が拡大し、多様なアプリケーションに適用されることを示しています。特に、エージェントは単なる自動化ツールにとどまらず、複雑なタスクの解決を支援する強力なシステムとして進化しています。今後もこの分野の動向には注目ですね。

さて、今日はここまでで、紹介した記事を駆け足でおさらいしますと、AIエージェントの進化、LLMのコーディング能力向上、delyのデータ基盤の刷新、browser-useライブラリの機能、そしてビッグテックのAIエージェント動向についてお話ししました。

次回もお会いできることを楽しみにしています！詳しい内容はショーノートに書いてありますので、ぜひチェックしてみてくださいね。また、番組の感想もお待ちしています！それでは、またね！