#
446
2025/8/6
今日のトレンド

Claude Codeとgpt-ossの活用

こんにちは、マイクです!今日は2025年8月6日、火曜日ですね。今日はZennでトレンドの記事をいくつかご紹介しますよ!

さて、前回紹介した記事ですが、期待の新星 Expo UI を触ってみる、LLMが理解できるコードの地図 ─ Serena MCPでAIが賢くなる仕組み、Tailwind CSS で未定義のクラスを指定したら絶対エラーにしたい、というタイトルでした。これらの内容については、ぜひショーノートで振り返ってみてくださいね。

それでは、今日紹介する記事の本数は5本です!早速、内容に入っていきましょう!

まず最初の記事は、「Claude Codeを開発の全フェーズで活用したら開発生産性が1.5倍に向上した」です。著者はClaude Codeの導入によって、開発の生産性が1.5倍に向上したと報告しています。最初はGitHub Copilotを使っていたそうですが、Claude 4モデルのリリース以降、エージェントの活用比率が増加しました。要件定義からDB設計、タスク分解、コーディング、動作確認まで、開発全フェーズでClaude Codeを活用しています。

具体的には、要件定義では議事録を基に機能要件を整理してブラッシュアップ、DB設計ではClaude Codeと対話しながらERDを生成し、レビュー後にマイグレーション用SQLを作成しています。タスク分解では要件を分析し、実装計画を細分化。コーディングではgit worktreeを使用し、複数のClaude Codeを並行して動かして効率的に進めています。

手作業が減ったことで思考を重視できるようになり、PR数も増加したとのことです。今後も生産性向上を目指し、ボトルネックの改善に取り組む意向を示しています。

。...。

次にご紹介するのは、「gpt-ossの推論速度とShaberi3ベンチマーク結果まとめ」です。本記事ではOpenAIの生成AI「gpt-oss」の推論速度やShaberi3ベンチマークの結果がまとめられています。対象読者は、日本語性能に興味がある方やOpenAIの「gpt-oss」に関心を持つ方です。

計測環境にはEVO-X2(Ryzen AI Max+)、Mac Studio(M2 Ultra)、RTX 3090が使用され、推論速度の測定にはllama.cppのllama-benchを使用しました。結果として、RTX 3090のプロンプト処理が非常に速いことがわかりましたが、EVO-X2は生成速度は良好ながらプロンプト処理が遅いという結果に。

特に、gpt-ossではトークン生成においてflash-attentionの効果が顕著で、Mac Studioでは20Bモデルのpp512/tg128で1674.75トークン/秒を記録、一方でEVO-X2では20Bモデルのpp512/tg128で616.57トークン/秒という結果でした。

Shaberi3ベンチマークでは、gpt-oss:20Bの日本語性能がQwen3-30Bシリーズには及ばないものの、gpt-oss:120BはQwen3-235Bよりも優れている可能性が示唆されています。gpt-ossはreasoningを行うことで論理的な出力が可能である点が強みです。

。...。

続いて、3つ目の記事は「今日から始める Vibe Data Science - Preview となった Data Science Agent でデータ分析してみる」です。2025年8月5日より、Colab EnterpriseとBigQuery StudioのNotebookでData Science Agent (DSA)のプレビューが始まりました。DSAはデータ分析作業をNotebook上で自律的に実行するツールです。

DSAはGemini CLIによるコーディングを「Vibe Coding」と呼ぶならば、DSAは「Vibe Data Science」と名付けられています。DSAはColab EnterpriseのGeminiアイコンから呼び出し、チャットインターフェースを通じて分析指示を行います。

例として、ペンギンデータを用いた回帰分析の手順が紹介されており、ユーザーはプロンプトを入力することで分析方針を受け取り、それを承認して実行します。DSAはデータの読み込みから前処理、モデルのトレーニング、評価までを自動化し、分析結果の解釈も行います。

また、回帰診断図を作成したり、他のモデルとの比較も可能です。DSAはデータ分析の効率化を実現し、特に大学レベルのタスクでは十分なパフォーマンスを発揮するとされています。今後の多機能化が期待されており、エンジニアはより簡便にデータ分析を行えるようになるでしょう。

。...。

次は、4つ目の記事「Flutter で値オブジェクトに extension types を導入して 31% パフォーマンスが改善した話」です。Sally株式会社のCTOが、Flutterアプリケーションの値オブジェクト実装にDart 3.3から導入されたextension typesを採用し、パフォーマンスを31%改善した事例を紹介しています。

値オブジェクトはドメイン駆動設計で重要な概念で、型安全性を保ちながらバグの早期発見につながります。同社のアプリ「ウズ」では、これまで抽象クラスベースで値オブジェクトを実装していましたが、実行時のパフォーマンスオーバーヘッドが問題に。

Dart 3.3のextension typesを導入し、オーバーヘッドをゼロにすることで全シナリオでのパフォーマンスが平均31%向上しました。主な改善要因はオブジェクト生成コストの削減やメモリアクセスの効率化です。型安全性を犠牲にすることなく、パフォーマンスを大幅に改善できたとのことです。

。...。

最後の記事は「OpenTelemetry x Datadog で実現する分散トレーシング」です。株式会社カナリーの開発チームが、Datadogを使用して新規プロダクトで分散トレーシングを実現した方法を解説しています。分散アーキテクチャはFrontend、API Gateway、Microserviceから構成されています。

具体的な実装方法では、FrontendでDatadogのHTTPヘッダーを設定し、API Gatewayで受け取り、gRPCサーバーへ伝播します。API Gatewayの設定にはOpenTelemetryのTracer Providerを初期化し、Datadog形式に対応したTextMap Propagatorを実装する必要があります。

最終的にFrontendからAPI Gateway、MicroserviceにかけてのContext Propagationが実現。これにより、エラーログのデバッグが容易になり、リクエスト単位でのエラーログの確認が可能になります。分散トレーシングは各サービスの因果関係を明確にし、効果的なデバッグを実現します。

さて、今日は5本の記事を駆け足でおさらいしました!次回も新たな情報をお届けできるのを楽しみにしています。詳しい内容はショーノートに書いてありますので、ぜひチェックしてくださいね。また、番組の感想もお待ちしています!それでは、良い一日を!

Related episodes

内容の近いエピソードを推薦しています