システムアーキテクチャ
Faxiのコンポーネントとデータフローの概要
AIモデル&テクニック
最先端のAIが正確なFAX解析を実現
マルチモデルAIパイプライン
Faxiは複数の専門モデルを組み合わせた高度なAIパイプラインを使用しています。各モデルは特定のタスクに特化しており、その出力を組み合わせることで全体的な高精度を実現します。
Vision AI (GPT-4 Vision)
OCRと視覚分析
FAX画像から印刷テキストと手書きテキストの両方を抽出。高度なコンピュータビジョンで文書構造を理解し、フォームフィールドを識別し、日本語文字を高精度で認識します。
Annotation Detector
視覚的注釈認識
FAX上の手書きマーク(チェックマーク、丸印、矢印、下線)を識別。注釈を近くのテキストと関連付けてユーザーの意図を理解します。
Intent Classifier (Claude)
自然言語理解とアクション抽出
抽出されたテキストと注釈を分析して、ユーザーが実行したいアクションを決定。インテント(メール、ショッピング、予約など)を分類し、関連パラメータを高い信頼度で抽出します。
処理パイプライン
画像前処理
画質向上、ノイズ除去、傾き補正
ビジョン分析
テキスト領域の抽出と視覚要素の識別
注釈検出
手書きマークの検出と分類
インテント抽出
ユーザーの意図を理解しパラメータを抽出
信頼度スコアリング
各コンポーネントの信頼性を評価
全体パフォーマンス
技術スタック
Faxiプラットフォームを支えるモダンでスケーラブルな技術
フロントエンド
Astro
高速な静的サイトジェネレーターで最適なパフォーマンスを実現
TypeScript
型安全なJavaScriptで堅牢なコードと優れた開発者体験を提供
Tailwind CSS
ユーティリティファーストCSSフレームワークで迅速なUI開発と一貫したスタイリング
バックエンド
Express.js
Node.js用の高速で最小限のWebフレームワーク
PostgreSQL
ユーザー、ジョブ、メトリクスを保存する堅牢なリレーショナルデータベース
Redis
ジョブキューとキャッシュ用のインメモリデータストア
AI・機械学習
Claude (Anthropic)
インテント抽出と自然言語理解のための高度な言語モデル
GPT-4 Vision
OCR、手書き認識、視覚分析のためのマルチモーダルAI
インフラ
Telnyx
FAXの送受信のためのクラウドコミュニケーションプラットフォーム
Docker
一貫した開発・本番環境のためのコンテナ化
MCP統合
Model Context Protocolサーバーが外部サービスとの連携を実現
MCPとは?
Model Context Protocol(MCP)は、AIシステムが外部データソースやツールと安全に接続するためのオープンスタンダードです。Faxiでは、メール、ショッピング、予約などの機能を拡張するためにMCPサーバーを使用し、ユーザーは使い慣れたFAX機からこれらのサービスにアクセスできます。