zenncast

どうも、マイクです。おはようございます。
六月二十九日、月曜日の朝七時をちょっとまわったところです。
今朝も zenncast、お付き合いありがとうございます。
この時間は、テック系のナレッジ共有プラットフォーム「Zenn」から、今日のトレンド記事をピックアップしてご紹介していきます。

今日はリスナーのみなさんからのお便りはお休みなので、そのぶん、記事紹介をたっぷりめにやっていきますね。

さて、きょうご紹介する記事は、ぜんぶで五本です。
AIエージェントのループ設計、日本語文体チェックのツール、Claude Codeまわりの便利ツールが二本、それからLLMの事後学習の整理記事まで、かなり濃いラインナップになってます。

ということで、さっそく一つ目からいきましょう。

。。。。

一つ目は、新しい「ループエンジニアリング」っていう考え方と、それを実現するツール「TAKT」の入門モードを紹介している記事です。
ループエンジニアリングっていうのは、人間が「プロンプトを書いて、結果を見て、また直して…」っていう往復を、手作業で何度もやるんじゃなくて、「作業して、レビューして、修正する」っていうサイクルそのものをシステムとして設計して、自動で回しましょう、という発想のことなんですね。

この記事で紹介されている「TAKT」は、複数のAIエージェントに役割を分けて、このループをぐるぐる回してくれるツールなんですが、本格運用しようとすると、設定とか設計のハードルがちょっと高い、っていう弱点があったそうなんです。
そこで出てきたのが、入門用のモード「タクト・エグゼック」、コマンド名で言うと `takt exec` です。

この `takt exec` は、対話形式でタスクを伝えて、最後に「スラッシュ・ゴー」、`/go` と打つだけで、ワーカー役とレビュー役のエージェントによる改善ループが自動で走る、というモードになっています。
その前の「スラッシュ・セットアップ」、`/setup` では、ワーカーとレビュー担当の人数とか、それぞれの役割、参照する知識やポリシー、それから使うモデルなんかを、けっこう細かく設定できるようになっていて、特化したエージェントを増やすことで精度を上げる、ということもできるそうです。

面白いのが、一度作ったこの構成をプリセットとして保存して、あとで再利用できる点ですね。
さらに「これはいい構成だな」と思ったら、そのままワークフローとしてエクスポートして、本格運用のほうに回すこともできるようになっています。
つまり、最初は「軽く試すモード」として使い始めて、手応えがあれば、そのままプロダクション寄りのワークフローに昇格させられる、っていう流れです。

裏側では、決定論的なワークフローエンジンが動いていて、「レビューでエヌジーが出たら、必ず再実行する」みたいなルールどおりにループが進むようになっています。
これによって「今日はAIの気分がノらなくて、なんか挙動が違うな…」みたいなブレを抑えられるのがポイント。
さらに、各ステップの定義はテキストで読み書きできるようになっているので、「中身がブラックボックスにならない」っていうのも大きな特徴です。

なので、何かトラブルがあったときにも、「このステップで詰まってるな」とか「ここでレビュー条件が厳しすぎるな」みたいな原因を追いかけて、自分でループの構造を調整できるんですね。
プロンプト一発勝負から、「ループそのものを設計する」っていう一段上のレイヤーに関心がある方には、すごく刺さる内容になっています。

。。。。

二つ目は、「AIが書く日本語がなぜ『整ってるのに不自然』に感じるのか？」っていうテーマの記事です。
この違和感の正体を、英語を構造ごと直訳してしまう「カルク」、日本語だと「翻訳借用」と呼ばれる現象が生む「訳語臭」にある、と説明しています。

とくに問題になりやすいのが、「無生物主語プラス他動詞」の構文ですね。
たとえば「ファイルがスコアを下げる」とか、英語だと自然なんだけど、日本語としてはちょっと硬くて、よそよそしい言い方になりがちなパターン。
文法としては間違ってないし、意味も通じるんだけど、「なんか人間がふつうにしゃべる日本語じゃないよな…」というところに、モヤッとした不自然さが出てしまう、と指摘しています。

筆者は、自分のAI生成記事に対して、実際にチェックをかけてみて、
・無生物主語をどう言い換えるか
・名詞化された表現をどう「ほぐす」か
・「レベル」みたいな、一語訳に引っ張られた単語を見直す
・未定義の略語を見つける
といった、五つの具体的な欠点を機械的に検出して見せています。

ここから導いている大事なポイントが、「自然で美しい文まで、全部に赤を入れないこと」。
つまり、**反証可能な欠陥だけを検出して、美しさそのものは採点しない** という姿勢ですね。
「この表現は絶対におかしい」「この略語は記事中で一度も定義されていない」みたいに、事実としてチェックできるところに絞ることで、ツールがうるさくなりすぎず、書き手の個性も残せるようにしている、と。

この思想にもとづいて、VS Codeの拡張として日本語チェック用のスキルを二種類公開しています。
一つが「ジェイピー・スタイル・チェック」、`jp-style-check` で、こちらは読みやすさや表現の癖をチェックするもの。
もう一つが「ロジック・ジェイピー・チェック」、`logic-jp-check` で、こっちはそこに論理構成のチェックも加えた、少し厳しめのツールになっています。

自分の文章を読み返したときに、「どこか読みにくい気がするんだけど、どこをどう直していいのかわからない…」っていうモヤモヤを感じている人に対して、その違和感を具体的な直し方に変える道具として使ってほしい、という提案で記事が締めくくられています。
AI時代の「日本語の健康診断ツール」みたいな位置づけですね。

。。。。

三つ目は、Claude Code を使っている人向けの、レート制限の残量チェックツールを紹介した記事です。
何ができるかというと、五時間枠とか週間枠、それから追加クレジット枠の残りを、ブラウザを開かずに、ターミナルからワンコマンドで確認できる、Python製のCLIツールになっています。

コマンドとしては、「シーエルシー・レート」、`clc rate` と打つだけで、
・それぞれの残量がどれくらい残っているか
・次にリセットされるまで、どれくらい時間があるか
をまとめて表示してくれます。
`watch` コマンドと組み合わせると、一定間隔で自動更新させてモニタリングっぽく使うこともできるので、長時間の作業中に「そろそろリミット近いな…」っていうのが、ひと目でわかるようになります。

インストール方法もシンプルで、基本はリポジトリを git clone して、エイリアスを一つ追加するだけ。
依存ライブラリも、Pythonの標準ライブラリだけで動くように作られていて、不要なパッケージを入れたくない人にも優しい設計です。
認証情報は、macOS ならキーチェーンから、ほかの環境では設定ファイルから自動で取得してくれるようになっていて、Windows、Linux問わず利用可能です。

設定ファイルの `config.json` をいじることで、プログレスバーの長さや、色分けの閾値、「どのラベルをどう表示するか」「表示の順番をどうするか」、さらに追加枠の月額上限なんかも、コードを書き換えずにカスタマイズできるようになっています。
なので、「自分は追加クレジットはここまでに抑えたい」という金額を入れておけば、そこに対して今どれくらい使っているか、っていう見え方もできるわけですね。

既存の先行ツールと比べたときの特徴としては、常駐プロセスとか、tmux みたいなセッションマネージャーに依存していない点です。
あくまで単一のスクリプトとして、「必要なときにサッと起動して、サッと残量を確認する」という用途に割り切っている。
そのうえで、使用率に応じた三色表示や、extra usage の金額表示など、「いまの自分の使い方がどれくらい危ないのか」を直感的に把握できるような工夫も盛り込まれています。

Claude Code を日常的にがっつり使う人ほど、「あ、やば、もう枠がない…」っていう経験があると思うので、そういう方にはかなり便利そうなツールですね。

。。。。

四つ目は、同じく Claude Code 関連なんですが、今度は「セッションを見下ろし型のオフィスみたいにリアルタイムで可視化するデスクトップアプリ」を紹介している記事です。
イメージとしては、ローカルのホームディレクトリ以下にある「ドット・クロード」、`~/.claude/` を監視して、そこにいるエージェントたちを「社員」、セッションや hooks の動きを「オフィス内での動き」として描画していく、というビジュアライザになっています。

これによって、どの hooks がどの範囲で効いているのか、いつ発火したのか、といった情報を、一画面で俯瞰できるのが大きな特徴です。
セッションごとに、どんな hooks、どんな Skills、どんな Agents がぶら下がっているのかを一覧できるので、「このセッションって、実際には何が起きてるんだっけ？」というのが視覚的に理解しやすくなります。

さらに、複数のセッションが同時に走っている場合でも、その進行状況をまとめて監視できるほか、「社員アイコン」をクリックすると、対応するターミナルウィンドウを前面に持ってくる、といった連携機能も備わっています。
裏側の実装は、Tauri（トーリ）というRustベースのフレームワークに、フロントエンドはReactとPixi.jsを組み合わせていて、ネイティブアプリっぽい見た目と動作の軽さをうまく両立させている感じですね。

設計上のこだわりどころとしては、「外部通信を一切行わず、ローカルのログだけを読む」という点が、かなり強調されています。
つまり、クラウドにログを飛ばしたり、解析サーバーに送ったりしないで、あくまで手元の `~/.claude/` の情報だけで完結する。
セキュリティ的にも安心だし、企業環境なんかでも導入しやすいスタンスです。

面白いのが、このアプリの開発プロセスそのものも、記事の見どころになっているところです。
筆者はRust未経験の状態からスタートしていて、実際のコードはほぼ Claude Code に書かせる形で進めた、と。
その中で、「一度散歩してから考え直して」とAIに声をかけると、新しい解法が出てくる、といった、ちょっとユニークなエピソードも紹介されています。
人間とAIの対話を通じて、アーキテクチャを練り直したり、バグの原因を一緒に探したりする、という新しい開発体験に気づけた、っていうところが、このツールの技術的な価値と並んで、もう一つのメッセージになっていました。

。。。。

そして五つ目、最後は、LLM の「事後学習」を整理した記事です。
ここでいう事後学習っていうのは、事前学習だけでは身につかない、「指示への従い方」とか「安全性」、それから「どういう手順で推論を進めていくか」といった振る舞いを、あとから作り込んでいくプロセスのことを指しています。

この記事では、「どんな**教師信号**、つまりどんな教え方を使ってモデルに学ばせるのか」という視点から、いろんな手法を整理しています。
たとえば、入力と模範応答のペアが用意できるなら、それを使って「エスエフティー」、SFT、教師ありファインチューニングで、基本的な形式や振る舞いを教えられます。
さらに、人間がつけた点数とか、好みのフィードバックがあるなら、「アールエイチエイチエフ」、RLHF や、その系統の DPO 系で、「応答全体としてどれが良いか」を学ばせることができます。

数学やコードみたいに、自動で正誤判定ができるタスクの場合は、「アールエルブイアール」、RLVR や、「ジーアールピーオー」、GRPO のような手法で、自動テスト結果を報酬として作り、それを教師信号として使うやり方も整理されています。
さらに一歩踏み込んで、「オーピーディー」、OPD や「オーピーエスディー」、OPSD、それから自己蒸留型の「エスディーピーオー」、SDPO といった手法では、生成の途中の各トークンごとに、教師モデルの出す分布や、「正解・実行結果」を条件にした分布を使って、「どこをどう直すべきか」をかなり細かい粒度で教える、という話も出てきます。

こういうふうに並べていくと、名前もアルファベットだらけで混乱しがちなんですが、筆者が最後に強調しているのは、「どの手法名を使うかが本質ではない」という点です。
いちばん大事なのは、自分が扱っているタスクで、どんな失敗が観測できるのか、それをどの粒度で記録できるのか。
そして、その失敗情報を「どんな形式の教師信号に変えて、学習に戻していくのか」という設計こそが、本質だとまとめています。

つまり、「この失敗は、応答全体としての善し悪しでフィードバックしたほうがいいのか」「それとも、この一個一個のステップについて、細かく教え直す必要があるのか」といったレベル感を考えながら、SFT なのか RLHF なのか、あるいはOPD系なのか、という“教え方”を選んでいきましょう、というメッセージですね。
モデルをどう「しつけるか」を、教師信号の設計という観点から俯瞰した、読みごたえのある整理になっていました。

。。。。

ということで、きょうの zenncast は、
まず一つ目に、AIエージェントの「作業→レビュー→修正」のループをシステムとして設計して、自動で回すための入門モード `takt exec` のお話。
二つ目に、AIが書く「整ってるのに不自然」な日本語を、カルクと訳語臭という観点から分析して、日本語チェック用の VS Code プラグインを提案する記事。
三つ目に、Claude Code のレート制限残量を、ターミナルから一発で確認できるPython製CLIツールの紹介。
四つ目に、Claude Code のセッションを「見下ろし型オフィス」として可視化する、ローカル完結のデスクトップアプリと、そのAI駆動な開発プロセス。
そして最後五つ目に、LLM の事後学習を、教師信号の種類と粒度から整理した記事を、お届けしました。

気になる記事があった方は、詳しい情報やキーワードはこの番組のショーノートにまとめてありますので、あとでゆっくりチェックしてみてください。
番組の感想や、「こういう記事も取り上げてほしい」といったリクエストも、いつでも募集中です。あなたの一言が、次回のラインナップを変えるかもしれません。

それでは、きょうも良い一日をお過ごしください。
zenncast、パーソナリティのマイクでした。
また次回、お耳にかかりましょう。