映像のオブジェクト認識を元に発言の内容を生成することも可能

映像のオブジェクト認識を元に発言の内容を生成することも可能