#
494
2025/9/23
今日のトレンド

TikTok ZKPとMeta RAG

皆さん、こんばんは!マイクです。今日は2025年9月23日、月曜日です!今夜も「zenncast」にお付き合いいただき、ありがとうございます。今日はZennで今日トレンドの記事を紹介していきますよ〜!

それでは早速、今日の内容に入っていきましょう。最初にお知らせですが、今日は5本の記事を紹介します。それでは、どんな記事があるのか早速見ていきましょう!

まず1つ目の記事は「TikTokがゼロ知識証明の開発を始めた話」です。TikTokがオープンソースで発表したゼロ知識証明に関する取り組み、すごく興味深いですね!この技術を使うことで、ユーザーはサービス提供者を信頼しなくても良くなるなんて、まさに革命的です。

次に2つ目の記事、「RAGを30倍速くするMetaの新技術『REFRAG』」です。これはMeta社が提案した手法で、RAGの回答速度を劇的に向上させるというもの。最大で30倍も速くなるって、エンジニアたちには嬉しいニュースですね!

続いて3つ目の記事は「JavaScriptで人と同じように文字数を数える」です。JavaScriptの文字数計算の仕組みについてのお話ですが、Unicodeに依存していて人間の感覚とは異なるというのが面白いですね。正確に文字数を数えるための方法も紹介されています。

さて、4つ目の記事は「都市部の自動運転を支えるマップマッチング」です。自動運転技術の進展において、マップマッチングがどのように役立つのか、興味深いですね。特に都市部での課題解決に向けた取り組みが紹介されています。

最後に5つ目の記事、「【Terraform 1.14】terraform query コマンドで既存リソースを一括 import する」です。Terraformの新機能が登場し、管理外のリソースを一括でimportできるようになるなんて、インフラ管理がずいぶん効率化されそうですね。

それでは、ここからはそれぞれの記事について詳しくお話ししていきますよ〜。まずは1つ目の記事から、TikTokのゼロ知識証明についてお話ししますね。.

TikTokは、Trusted Execution Environment(TEE)とRemote Attestation(RA)技術にゼロ知識証明(ZKP)を組み合わせた仕組みをオープンソースで公開しました。TEEはセキュリティ機能を持つ実行環境で、外部からの攻撃に対してデータを保護します。そして、RAはクラウド環境が信頼できるかを確認する仕組みなんです。これにより、信頼の境界が拡大し、潜在的な攻撃のリスクが増すため、ZKPが必要とされるようになったんですね。

ZKPは、ある主張が正しいことを証明し、その詳細を開示しない手法です。この技術を利用することで、ユーザーはサービス提供者を信頼する必要がなくなるという点が魅力的です。TikTokはCircomというツールを使用して、TEEの証明書検証アルゴリズムを記述し、zkSNARKsを用いて証明・検証鍵を生成しています。これにより、数学的な証明をもとにTEEの信頼性を確認できるようになります。

TikTokがこの技術を採用した背景には、技術的な課題と社会的な信用問題があります。特に、アメリカをはじめとした各国のデータプライバシーに対する懸念を払拭するために、信頼性の高いプライバシー保護を実現しようとしているんです。今後、TikTokがこの技術を実装することで、他の業界でもZKPの活用が広がることが期待されています。.

続いて、2つ目の記事、Metaの新技術「REFRAG」についてお話しします。REFRAGは、RAG(Retrieval-Augmented Generation)の回答速度を最大30倍向上させる手法です。従来のRAGでは、関連文書をそのままLLM(大規模言語モデル)に渡していたため、入力が長くなり、レスポンスが遅くなるという問題がありました。

REFRAGでは、検索した文書をまずベクトル化し、ベクトル形式のデータをLLMに直接入力することで、劇的に応答速度を改善します。この手法の基本的なアイデアは、人間にとって冗長な言語をLLMに理解しやすい形に圧縮して渡すという点です。具体的には、まず関連文書を検索し、それを短いチャンクに分割してから、事前に学習した変換器を使ってベクトル化します。

このプロセスにより、最初のトークン生成までの時間が最大30.85倍も速くなり、回答精度を損なうことなく、従来手法と比べて3.75倍の速度向上を実現しています。また、LLMが扱えるコンテキストサイズも実質的に16倍に拡張可能です。この手法は今後のRAGの標準技術になる可能性が高いと考えられています。.

続いて、3つ目の記事、「JavaScriptで人と同じように文字数を数える」についてお話しします。JavaScriptでの文字数の計算は人間の感覚とは異なり、Unicodeでのエンコーディングに依存しているんです。人間は「A」や絵文字「😆」、「👨‍👩‍👧‍👦」をそれぞれ1文字として数えますが、JavaScriptはこれらを異なるCode Unit数として扱います。その結果、例えば「😆」は2、「👨‍👩‍👧‍👦」は11とカウントされてしまいます。

JavaScriptで人間のように文字数を数えるためには、`Intl.Segmenter`を使用すると良いでしょう。このオブジェクトは文字列を人間が認識できる単位に分割し、書記素基準で文字を数えることが可能です。具体的な実装方法も紹介されていますが、これを活用することで、文字列処理の精度が向上し、より自然な方法で文字数を数えることができます。.

続いて4つ目の記事、「都市部の自動運転を支えるマップマッチング」についてお話しします。E2E自動運転開発チームによるマップマッチング手法が紹介されていて、特にGNSSが不安定な環境での自己位置推定の改善に焦点を当てています。カメラによる画像認識結果とベクターマップをマッチングすることで、車両の位置を正確に補正する方法が述べられています。

具体的には、カメラ画像から白線や横断歩道などのマップ要素を抽出し、相対座標系に変換するプロセスが含まれています。特に、YOLOPv2モデルを用いてセグメンテーションを行い、LiDARの深度情報をもとにマップ要素の位置を相対座標に変換します。その後、small_gicpアルゴリズムを利用して自己位置を補正します。

記事では、マッピングにおける重要な技術要素や、自己位置が大きくずれている場合でも初期値を工夫することで探索を可能にする手法も紹介されています。都市部における自動運転の実現に向けた技術開発の重要性が強調されており、興味のあるエンジニアはこれらの技術に参加することが推奨されています。.

最後に5つ目の記事、「【Terraform 1.14】terraform query コマンドで既存リソースを一括 import する」についてお話しします。Terraform v1.14.0のbeta版がリリースされ、新機能として「List Resources」と「terraform query」コマンドが追加されました。これにより、Terraform管理外の既存リソースの一覧取得や一括importが可能になるんです。

まず、AWSプロバイダを設定し、`.tfquery.hcl`ファイルで`list`ブロックを定義します。この状態で`terraform query`コマンドを実行すると、指定したリージョン内の全EC2インスタンスが出力されます。さらに、既存リソースを一括でimportするには、`terraform query`コマンドに`-generate-config-out=<ファイル名>`フラグを付けて実行します。これにより、リソースとimportブロックが自動生成されます。

この機能により、Google Cloud Platformのterraformerのような機能が公式に実現可能になり、効率的なインフラ管理が期待されています。.

さて、今日はここまで! 今日紹介した記事を振り返ると、TikTokのゼロ知識証明から始まり、MetaのREFRAG、JavaScriptでの文字数の数え方、都市部の自動運転技術、そしてTerraformの新機能まで、多彩な内容でしたね。

次回もお楽しみにしていてください!詳しい内容はショーノートに書いてありますので、ぜひチェックしてくださいね。そして、番組の感想もお待ちしております!それでは、また次回お会いしましょう!マイクでした!

Related episodes

内容の近いエピソードを推薦しています