マイク:
みなさん、こんにちは。今日もzenncastスペシャルをお届けします。いつもは最新の技術トレンドをざっとお伝えしているんですが、今回は特別版ということでゲストの方とがっつり深掘りしていこうと思います。というわけで、早速ゲストを紹介しますね。
マイク:
今回のゲストは、僕の元同僚で今はプロダクトマネージャーとして活躍しているSaraです。彼女とはプライベートでもよく技術の話をしていて、なんだかんだ夜中まで盛り上がることもしばしば。今日はそのパッションをリスナーのみなさんとも共有できればと思っています。Sara、よろしくー。
サラ:
はい、みなさん初めまして。Saraです。私はプロダクトマネージャーとして、新しい技術を使っていろんな課題を解決するのが大好きなんです。でもエンジニアではないし、コードの細かいところまではわからないことも多いので、Mikeみたいなエンジニア仲間にいっぱい聞きながら勉強する日々です。
マイク:
というわけで、今日はそんなSaraと一緒に、今注目のAIエンジニアリングツール『Devin』について掘り下げていきます。2024年3月に、Cognitionというスタートアップが発表した世界初の完全自律型AIソフトウェアエンジニアって肩書なんだけど、SaraはDevinって聞いたことあるかな?
サラ:
名前だけはちらっと聞いたかも。完全自律でコードも書いてデバッグもしてくれるとか...ほんとにそんなことできるの?どんなツールか興味津々!
マイク:
まさにそのとおり。GitHub Copilotみたいなコード補助ツールとは違って、要件やプロンプトを与えれば、システム設計から実装、デバッグ、そして本番デプロイまでも自動でこなすと言われてる。しかも人間のエンジニアと対話しながら、あたかも“熟練したチームメイト”みたいに動くのが特徴なんだよね。
マイク:
で、Devinなら、例えば『このライブラリを使ってこんなアプリを作って』みたいに伝えると、必要なライブラリを調べて、コードを書いて、テストして、さらには運用環境にデプロイまでしてくれる。リアルタイムで進捗報告もするから、ユーザーは途中で『あ、やっぱりUIはこのフレームワークで』とか、フィードバックを与えられる。それを受けて設計を修正しながら仕上げていく感じ。
サラ:
すごいね。まるで人間のエンジニアみたいに、タスクをこなしたり学習したりして成長していくの?
マイク:
そう。長期的な推論が得意らしくて、コードを書くときに何千という判断が必要だろうけど、それを自律的にやってくれる。作業中のエラーを見つけたらトライアンドエラーで修正して、問題解決した知識を次に活かす。しかもクラウドのサンドボックス環境でシェル操作とかブラウザ検索まで自分でやるんだ。
マイク:
実際の性能を図るために、ソフトウェア開発のベンチマーク集『SWE-bench』を使った比較があってね。Devinは約13.86%の課題を自動解決したそうなんだ。これがGPT-4とかClaude 2みたいな他のモデルの数%と比べると、段違いに高いんだよ。Cognition社が言うには、この結果は序章だって言ってる。今はソフトウェア開発に特化してるけど、将来は他分野にも応用していく構想らしい。
サラ:
へえ、そんなすごい子なんだ。でも実際、具体的に何ができるのかもう少し聞きたいな。例えばコーディング以外にも何かある?
マイク:
いろいろあるよ。ざっと言うと、まず新規アプリ開発。フロントからサーバまでシステムの骨組みを作ってくれる。次にバグ修正。既存コードを読み込んで、エラー箇所を自動で特定して直してテストして、って一連のデバッグもやる。リファクタリングにも強くて、レガシーコードをモダンなフレームワークに移行してくれたり、複雑な関数群をきれいに整理したりしてくれる。
マイク:
さらにドキュメントまで整えるんだよね。コードに合わせてREADMEや仕様書を更新してくれたり、チーム固有のルールに合わせた解説を追加したり。あとはテスト作成やCI/CDのパイプライン連携にも対応していて、Pull Requestを自動で出してテストに失敗したらロールバックして直す、みたいなこともする。
マイク:
日常的な使い勝手も考えられていて、Slackにメンションするだけでバグ修正タスクを動かすとか、VS Codeの拡張でPRを確認するとか、そういう開発フローへの統合もばっちり。で、一度解決した問題や学んだ知識を“Knowledge”としてストックして、次から同じようなバグに遭遇したときにすぐ対応できる仕組みがあるんだ。まさに経験を積んでいくイメージだね。
サラ:
まるで何人ものジュニアエンジニアが常にタスクをさばいてくれるみたい。そうなると、もう実際に企業で導入し始めてるのかな?使われてる事例ってある?
マイク:
あるよ。例えばブラジルの大手デジタル銀行Nubank。ここは10万個のデータクラスを新アーキテクチャに移行する、っていう超大規模プロジェクトを抱えてたんだけど、Devinを導入して並列でタスクを実行させたら、作業効率が8〜12倍に跳ね上がったんだって。しかもコストが1/20に削減。これでエンジニアは基本レビューだけに注力すればOKになり、かなり助かったらしい。
マイク:
MongoDB社や経費管理サービスのRamp社でも活用してる。MongoDBは古いコードのモダナイズにDevinを活用しているそうで、顧客企業がアップグレードするときの負荷をすごく下げる仕組みづくりに貢献しているみたい。Ramp社はテスト作成や不要コードの整理をDevinに任せて、日常的にコードの品質向上を図ってるという。
サラ:
なるほど。そういった先進企業が活用してるなら信頼度も高まりそう。日本企業でも試してるところあるの?
マイク:
うん、日本でも少しずつ導入が始まっている。既存システムのフレームワーク刷新やレガシー関数のリファクタを試験的にDevinに任せて、短期間で品質の高いコードが仕上がったっていう話があるんだ。やっぱり最初は多少手直しが必要だけど、それでもエンジニアの工数は格段に減る、っていうレポートが出てるね。
マイク:
ちなみに、Cognition社という会社がDevinを開発してるんだけど、ここは2023年11月に米国でできたばかりの若い企業なんだ。創業メンバー3人はみんな世界的な競技プログラマで、国際情報オリンピックの金メダリストっていうからもうエリート中のエリート。CEOのスコット・ウーさんはハーバード卒の28歳で、IOIで3度金を取ってる。
マイク:
そうそう、メンバーにIOI金メダルが何個も集まってるっていう驚異のチーム体制で、短期間で大躍進してる。資金調達もFounders FundとかStripeの創業者とか超有名な投資家がいっぱい付いてて、創業半年で企業評価額20億ドルを超えたユニコーンになったとも言われてるよ。
マイク:
で、Cognition社は“AIによる推論能力”を解明して実用化する、っていうビジョンを掲げてる。その最初のプロダクトがDevinだ。人間みたいに目的を達成するAIをつくる、っていう大きいチャレンジを本気でやってるわけだね。
サラ:
なんだかワクワクするけど、一方で料金とか気になるところ。
マイク:
そこもちゃんと情報が出てて、2024年12月に一般提供が始まった。無料プランはないから、それなりにお高い。基本的にはTeamプランっていう月額500ドルのサブスクリプション、それからEnterpriseプランっていう大企業向けのカスタム契約の2つがある。
マイク:
Teamプランだと、月額500ドルで250ACUまで使える。ACUっていうのはエージェントの作業実行単位で、大体15分くらいDevinが動くと数ACUって感じ。もし使いすぎたら従量課金が追加されるイメージだね。Slack連携、IDE拡張、REST APIみたいな基本機能が使える。
マイク:
一方Enterpriseプランは料金が数千ドル〜数万ドルクラスで、専用の高性能モデルや並列実行オプション、オンプレミスでVPCに導入するオプション、セキュリティ管理機能、専任サポートが付いたりする。大規模に導入して何十人ものエンジニアがDevinの“軍隊”を走らせられるわけだ。
サラ:
なるほど。大きな企業やプロジェクトなら、そういう本格的なプランが必要ってことね。
マイク:
そうそう。実際Nubankみたいなケースは並列実行をフル活用してたし。で、Devinが普及すると、ソフトウェア開発のやり方が大きく変わる可能性があると思う。エンジニアリングの生産性が爆上がりして、定型的な繰り返し作業はAIに任せられるようになる。そうするとエンジニアは、よりクリエイティブな設計や企画にエネルギーを注げるようになるんじゃないかな。
マイク:
ただ、その一方で『エンジニアの仕事がなくなるんじゃないか』っていう不安もある。雑誌でも『このAIは開発者の職を奪う可能性がある』と書かれていた。ただCognition社のCEOは『需要は供給を上回り続けてるから、すぐに職がなくなるわけじゃない』って話してる。現状のDevinはまだ人間のレビューや要件定義が不可欠だし、大規模システム全体を完全に構築するのは難しい部分もある。
マイク:
そしてもちろん、AIが勝手にバグを埋め込むリスクやセキュリティ面の懸念もあるから、ちゃんと運用体制を整えて、デプロイ前に人間がレビューするフローが必要。とはいえ、このテクノロジーはソフトウェア開発の構造を変える可能性が高い。最終的には『要件を伝えるだけで完成』なんて未来が来るかもしれないね。
サラ:
夢が広がるね。そう考えると、自分でもDevinを使って何か作ってみたくなっちゃう。でも今すぐはちょっと月額500ドルはハードル高いかな...。
マイク:
わかる。個人向けプランもいずれ出るかも、みたいな話もあるらしいし、もしそれがリーズナブルな価格帯で来れば、Saraでも気軽に遊べそうだよね。今は企業向けでガチのプロジェクトを回す用途がメインだから、そこそこの値段になるのも仕方ない感じがするかな。
サラ:
私としては、まずは会社で試せる日が来たらいいなと思ってる。もし導入できたら、さっそくちょっとした社内ツールのリファクタリングを頼んでみたい!
マイク:
いいね。それで実際にどんなコードが出てくるか検証して、成果物をレビューしてみるっていうのはいい体験になるんじゃないかな。あと、せっかくならDevinにドキュメントも一気に作り直してもらったりして、本当にどこまで現場で役立つかを試すと面白いと思うよ。
サラ:
うん。今日の話ですごくDevinの可能性が見えてきた気がする。プログラミング未経験者でも、しっかり要件を伝えられればアプリを作れそうっていうのはすごいインパクトだね。
マイク:
まさに“開発の民主化”って感じ。まだ課題もあるし、万全ではないけど、ソフトウェア開発を一歩先に進める大きなテーマとしてDevinは注目されてる。これからも改良が進んで、さらに精度が上がったら、今まで手が回らなかったプロジェクトが一気に実現するかも。
マイク:
ということで今日は、Cognition社が生んだ完全自律型AIエンジニア『Devin』についてお送りしました。エンジニアの働き方も変わるし、プロダクトマネージャーのSaraのような人にも新しいチャンスが生まれる技術だと思う。
サラ:
いやー、めちゃくちゃ面白かった。ありがとう、Mike。これから私自身もDevinをウォッチして、いずれ導入に踏み切れそうだったら思いきって試してみる。いつかDevinと一緒に新しいプロダクトを作る日が来るかもね!
マイク:
うん、その時はぜひ一緒にやろう!というわけで、今日はここまで。zenncastスペシャル、聞いていただきありがとうございました。次回も技術の話をみっちりお届けします。ではまた!