こんにちは、皆さん!マイクです!今日は2025年2月13日、火曜日ですね。さて、今日の「zenncast」では、Zennでトレンドの記事をいくつかご紹介していきますよ!
まずは、前回紹介した記事についてですが、今回は特に触れることはありませんので、早速今日の内容に移りましょう!
今日紹介する記事は全部で5本あります。まずは1つ目の記事から行ってみましょう!
1つ目の記事は「RAGでも『深い検索』を実現する手法『DeepRAG』」についてです。このDeepRAGは、中国科学院ソフトウェア研究所とWeChat AIの研究者によって提案されたもので、従来のRAGの課題を克服するための手法です。ユーザーの質問に対して、必要な知識を考えて、検索が必要かどうかを判断するんですね。この過程にはマルコフ決定過程が使われていて、質問をサブクエリに分けて、それぞれに対する回答を生成します。なんと、従来手法と比べて回答精度が平均21.99%も向上したんですよ!これはエンジニアにとっても大きな進展ですね。
。。
次は2つ目の記事「gemini-2.0-flashが賢くてコスパがよすぎる件」です。このgemini-2.0-flash、LLMをAPIで利用する際の優れた選択肢として注目されています。特にコストパフォーマンスが抜群で、価格が安いのに高性能だということで、APIを通じて与えたコンテキストの理解力や指示の追従性が素晴らしいんですよ。文章の分析や構造化出力を行う際に中間分析を取り入れることで、誤った情報を減少させる効果もあるんです。技術文書の分析ツール「Tascario」の開発事例も紹介されていて、これからのエンジニアにとっては必見の内容ですね。
。。
3つ目の記事は「Azure Database for MySQLのIOPS設定の変更で月額約100万円のコストダウンが実現しました」という内容です。イオンスマートテクノロジー株式会社のSREチームが、IOPS設定を変更した結果、日額で約4万円のコスト削減を達成した事例です。これにより、月額約100万円、年間では約1200万円の削減が見込まれているんですね。変更はTerraformを用いて行い、オンラインでスムーズに実施されたとのこと。コスト意識の向上とリソース最適化が追求されていて、計測に基づくチューニングの重要性が再確認された事例ですね。
。。
次は4つ目の記事「Storybook Test runnerを活用した品質向上戦略とVRTの安定化」です。これはVisual Regression Test (VRT) の安定化を図るための戦略を紹介している内容です。画像をbase64エンコードで使用することでVRTの安定性を向上させる方法や、MSWを用いた画像の一括モック手法が提案されています。また、Storybook Test runnerを使ったランタイムエラーの検知が可能になり、メンテナンス性が向上することも強調されています。これにより、フロントエンドエコシステムに適応するための柔軟な選択が重要だということが伝えられています。
。。
最後は5つ目の記事「LLMの重みの量子化でパフォーマンスが改善する仕組みについて」です。ここでは、重みの量子化がシステムのパフォーマンスを改善する仕組みを解説しています。特に、メモリバウンドな環境において量子化を行うことで、GPUの利用率が理論上4倍に増加する可能性があるということが示されています。AWQの実験では、約3倍の速度改善が確認されており、重みの量子化は非常に有効な手法であると結論づけられています。
さて、今日はここまでで、紹介した記事を駆け足でおさらいをしてみました!DeepRAGやgemini-2.0-flash、Azure Databaseのコスト削減など、様々なトピックがありましたね。
次回お会いできるのを楽しみにしています!詳しい内容はショーノートに書いてありますので、ぜひそちらもチェックしてみてくださいね。番組の感想もお待ちしています!それでは、また次回お会いしましょう!