#
502
2025/9/30
今日のトレンド

LinuxカーネルとOnnxOCR

こんにちは、みなさん!マイクです!今日は10月1日、火曜日ですね。さて、今日も「zenncast」をお楽しみいただきありがとうございます!今日はZennでトレンドの記事をいくつかご紹介しますよ。

それでは、さっそく今日の内容に入っていきましょう!

まずは、今日紹介する記事の本数ですが、全部で5本お届けします!それでは、一つずつ詳しく見ていきましょう。

まず最初の記事はこちらです!タイトルは「全プロセスが一秒止まる不具合、原因はLinuxカーネルにあり?」です。

チューリング社の坂本さんが、自動運転システムで発生した不具合について解説しています。この不具合は「全プロセスが一秒間停止する」というもので、再現が難しく原因特定に手間取ったそうです。自動運転システムはカメラを使用してリアルタイムでデータをやり取りする構造で、データ収集車からは動画やLidarデータが収集されます。

この不具合は、データ収集時に動画のフレームが欠ける現象として現れました。調査の結果、プロセス間通信が約1秒間途絶えていることが判明し、カーネル側の問題である可能性が浮上。最終的に、kswapdプロセスが動作するとシステム全体の処理が停止することが原因であることが特定されました。

対策として、ユーザープロセスからの要求に対してZone DMAを使用しない設定に変更され、不具合は解消されたそうですが、まだまだ明らかではない点もあるようです。坂本さんは、チューリングで共に働く仲間を募集中とのことです。

続いて、2つ目の記事です!タイトルは「GPUなしローカルでも高速・高精度なOCRができるOnnxOCRが凄い」です。

社内のデジタルトランスフォーメーションを進める中で、アナログデータのOCRが求められたことから、OnnxOCRというライブラリが発見されました。このライブラリは、PaddleOCRをベースにしていて、軽量で高精度、そして推論速度が圧倒的に高速です。

OnnxOCRは商用利用も可能で、インストールも簡単。数行のコードでOCRが実行できるのが魅力的です。また、ONNXのエコシステムを利用することで、高速化を実現しています。

実際にOnnxOCRを他のOCRエンジンと比較した結果、推論速度と精度の両方で優れたパフォーマンスを示しました。特に、傾き補正機能により、変形した文字も高精度で認識できるとのこと。驚くべき進化ですね!

さて、3つ目の記事に移ります!タイトルは「Codex CLI を初めて使う人向けの実践ガイド」です。

この記事では、OpenAI Codex CLIの基本的な使い方が説明されています。Codexはターミナルで動作するローカルのコーディングエージェントで、自然言語での指示によってコードの生成や編集を行います。

初めての方でも簡単に導入できるように、インストール手順や各コマンドの使い方が詳しく紹介されています。特に、音声入力の活用も提案されていて、作業効率の向上に繋がるとのことです。

最後に、Codexの改善点やユーザーからのフィードバックも紹介されており、エンジニアにとって非常に強力なツールであることが伝えられています。

それでは、4つ目の記事に行きましょう!タイトルは「DuckDB-Wasm, MapLibre GL JS, CloudFlare Pagesを使って、オープンデータを可視化してみたときの学び」です。

著者は、行政組織のデータを用いて「まちきずき」というウェブサイトを構築しました。このサイトは、ブラウザ内でParquet形式のデータを検索できるように設計されていて、Cloudflare Pagesでホスティングされています。

開発の背景には、DuckDB-Wasmを用いたログ検索の経験があり、オープンデータの処理に役立つのではないかと考えたことがきっかけです。さまざまな技術的課題を乗り越えながら、データの整形やビルドプロセスにGitHub Actionsを使用するなど、効率的な開発が進められました。

最後、5つ目の記事です!タイトルは「サーバーレスで無料!DifyとCloudflare Workersで作るDiscord AIボット」です。

この本記事では、DifyとCloudflare Workersを利用して無料でサーバーレスのAI搭載Discordボットを作成する方法を解説しています。DifyのノーコードアプローチとCloudflare Workersのサーバーレス環境を組み合わせることで、常時稼働できるボットを実現します。

作成するボットは、Discordのスラッシュコマンド「/ask」を通じてユーザーがAIに質問し、Difyが応答します。手順はシンプルで、DifyでAIのロジックを構築し、Discord Developer Portalでボットアプリを作成するところから始まります。

このプロジェクトは、エンジニアにとって多くの学びや楽しみが得られる内容となっています。

さて、今日はここまで!それでは、今日お伝えした記事をサクッとおさらいしましょう!1つ目は自動運転システムの不具合、2つ目はOnnxOCRの高性能、3つ目はCodex CLIの使い方、4つ目はオープンデータの可視化、5つ目はDiscord AIボットの作成方法でしたね。

次回もお会いできるのを楽しみにしています!詳しい内容はショーノートに書いてありますので、ぜひチェックしてくださいね。番組の感想もお待ちしています!それでは、またね!

Related episodes

内容の近いエピソードを推薦しています