推しアイデア
基本機能に加え、独自の画像認識モデルを使用した拡張性の部分が推しアイデアです。 例えば、動物園で動物を識別させ、会話を通しその動物の成り立ちなどを知ることができ、電気屋さんでカメラをかざし、会話形式で性能を知ることなどができます。
基本機能に加え、独自の画像認識モデルを使用した拡張性の部分が推しアイデアです。 例えば、動物園で動物を識別させ、会話を通しその動物の成り立ちなどを知ることができ、電気屋さんでカメラをかざし、会話形式で性能を知ることなどができます。
少し前に猫は人の言葉がわかっているかもしれないというポストがXで一時期賑わっていました。自分はそこから擬似的になってしまいますが、動物と会話することができたらと考えたのがきっかけです。
YOLOv8を使用した画像認識と、それを追加学習させ対応したもののみ学習させるようにしたモデルを動かせるようにできたことが推し技術です。
いきものとカメラ越しに言葉を交わすことができるサービスです!
YOLOv8を使用した画像認識を行い、画像に写る物体を認識します。(認識の種類は80まで) そこからOpenAIのGPT4.1-nanoを使用し、その生き物or無機物との会話を楽しむことができます。
YOLOv8を追加学習したモデルで画像認識を行います。今回はメンバーの私物であるぬいぐるみ2つ&みゃくみゃくの三種を識別できるようにしました。 認識した結果、それに対応したプロンプトを呼び出し、対応した会話を行うことができます。
自分はこのプロダクトの拡張モードは今後さらなる発展性があると考えています。 例をいくつか上げます。