推しアイデア
「音声で対話するAIアシスタント」です。このシステムは、音声認識を活用し、ユーザーと自然な対話を提供します。質問に応じてAIがリアルタイムで応答。家庭やオフィスなど、さまざまなシーンで活躍できるスマートなアシスタントです。
―
「音声で対話するAIアシスタント」です。このシステムは、音声認識を活用し、ユーザーと自然な対話を提供します。質問に応じてAIがリアルタイムで応答。家庭やオフィスなど、さまざまなシーンで活躍できるスマートなアシスタントです。
現代の技術は、音声認識や生成AIによる自然言語処理、モーション検出などの分野で急速に進化しており、それらを組み合わせることで、ユーザーがより直感的に、手を使わずに操作できるシステムを提供することができると考えました。
「Python」です! Pythonは、今回の音声アシスタントシステムで使用するのに適したプログラミング言語です。シンプルで読みやすく、音声認識、モーション検出、AI応答生成(OpenAIなど)などのライブラリが豊富に揃っています。
このプロジェクトは、
・Raspberry Pi ・AWS IoT Core ・AWS Simple Queue Service ・AWS DynamoDB ・AWS CloudWatch ・AWS Lambda ・AWS EC2
を組み合わせて、ユーザーの音声入力に基づいたAI応答を音声で返すシステムを構築します。Raspberry Piのマイクで音声を認識し、テキスト化後、AWS IoT Coreを通じてメッセージが送信され、EC2上でAIが応答を生成し、再度IoT Coreを通じてRaspberry Piに返答を送信し、最終的に音声としてユーザーに再生します。
1.ラズパイで音声認識とテキスト化
2.テキストをAWS IoT Core経由で送信
3.IoT CoreからSQSにメッセージ転送
4.EC2でAI処理
5.生成した応答をIoT Core経由でラズパイに送信
6.ラズパイが音声合成し応答を再生