システムアーキテクチャ

Faxiのコンポーネントとデータフローの概要

マーケティングウェブサイト (Astro) ホーム / サービス / デモ / テック / ヘルプ HTTP/REST バックエンドAPI (Express.js) デモエンドポイント / メトリクスAPI / Webhookハンドラ AI処理パイプライン Vision AI OCR / 手書き認識 注釈検出 チェックマーク / 丸印 インテント抽出 アクション分類 MCPサーバー メール / ショッピング / AIチャット / 支払い / 予約 インフラストラクチャ PostgreSQL データストレージ Redis キュー&キャッシュ S3 ファイルストレージ Telnyx FAX API

AIモデル&テクニック

最先端のAIが正確なFAX解析を実現

マルチモデルAIパイプライン

Faxiは複数の専門モデルを組み合わせた高度なAIパイプラインを使用しています。各モデルは特定のタスクに特化しており、その出力を組み合わせることで全体的な高精度を実現します。

Vision AI (GPT-4 Vision)

OCRと視覚分析

92%
精度

FAX画像から印刷テキストと手書きテキストの両方を抽出。高度なコンピュータビジョンで文書構造を理解し、フォームフィールドを識別し、日本語文字を高精度で認識します。

マルチモーダル深層学習Transformerアーキテクチャ手書き認識フォームフィールド検出レイアウト分析

Annotation Detector

視覚的注釈認識

88%
精度

FAX上の手書きマーク(チェックマーク、丸印、矢印、下線)を識別。注釈を近くのテキストと関連付けてユーザーの意図を理解します。

畳み込みニューラルネットワークエッジ検出アルゴリズム形状認識信頼度スコアリングバウンディングボックス回帰

Intent Classifier (Claude)

自然言語理解とアクション抽出

95%
精度

抽出されたテキストと注釈を分析して、ユーザーが実行したいアクションを決定。インテント(メール、ショッピング、予約など)を分類し、関連パラメータを高い信頼度で抽出します。

大規模言語モデルFew-shot学習コンテキスト認識解析エンティティ抽出意味分析

処理パイプライン

1

画像前処理

画質向上、ノイズ除去、傾き補正

ガウシアンブラー適応的閾値処理モルフォロジー演算
2

ビジョン分析

テキスト領域の抽出と視覚要素の識別

OCRレイアウト検出手書き認識
3

注釈検出

手書きマークの検出と分類

形状検出パターンマッチング空間分析
4

インテント抽出

ユーザーの意図を理解しパラメータを抽出

NLPエンティティ認識コンテキスト分析
5

信頼度スコアリング

各コンポーネントの信頼性を評価

アンサンブル手法不確実性定量化バリデーションチェック

全体パフォーマンス

90%+
全体精度
<5秒
平均処理時間
95%+
インテント分類
10+
対応ユースケース

技術スタック

Faxiプラットフォームを支えるモダンでスケーラブルな技術

フロントエンド

Astro

高速な静的サイトジェネレーターで最適なパフォーマンスを実現

TypeScript

型安全なJavaScriptで堅牢なコードと優れた開発者体験を提供

Tailwind CSS

ユーティリティファーストCSSフレームワークで迅速なUI開発と一貫したスタイリング

バックエンド

Express.js

Node.js用の高速で最小限のWebフレームワーク

PostgreSQL

ユーザー、ジョブ、メトリクスを保存する堅牢なリレーショナルデータベース

Redis

ジョブキューとキャッシュ用のインメモリデータストア

AI・機械学習

Claude (Anthropic)

インテント抽出と自然言語理解のための高度な言語モデル

GPT-4 Vision

OCR、手書き認識、視覚分析のためのマルチモーダルAI

インフラ

Telnyx

FAXの送受信のためのクラウドコミュニケーションプラットフォーム

Docker

一貫した開発・本番環境のためのコンテナ化

MCP統合

Model Context Protocolサーバーが外部サービスとの連携を実現

MCPとは?

Model Context Protocol(MCP)は、AIシステムが外部データソースやツールと安全に接続するためのオープンスタンダードです。Faxiでは、メール、ショッピング、予約などの機能を拡張するためにMCPサーバーを使用し、ユーザーは使い慣れたFAX機からこれらのサービスにアクセスできます。