このアプリケーションはSonyのSRD(Spatial Reality Display)を用いて立体的な映像を表示させるのを容易にするアプリケーションです。 主に次のような機能を提案します。
- 3DGSの理論を用いて動画から高精度な3D空間を作成、Unityのアプリケーションに送信します。
- 表示させている映像についての説明を生成AIを使用して音声会話で説明します。
- 表示している映像の操作などもAgent技術を用いて音声でできるようにします。
完全なアプリケーションはDockerでWEBアプリとして構築します。
- Docker compose
- Nvidia GPU
- CUDA Toolkit
- Visual Studio 2022
詳細な要件はNerfStudioの公式ドキュメントを参照してください。
以下の条件に当てはまる場合は環境ごとのデスクトップアプリとして提供します。
- すでに学習済みの3DGSデータ(PLYファイル)がある
- 複数のユーザーからのアクセスがなくデスクトップアプリのみで充分である
- Unity Hubを起動し、Unity 2020.3.14f1をインストールします。
- Unity Hubを起動し、プロジェクトを開きます。
このプロジェクトではpoetryを使用しています。poetryを使用していない場合はrequirements.txtを参照してください。
Devcontainer(Docker)を使用できる環境の場合、Devcontainerを使用することをお勧めします。
- このリポジトリをクローンします。
- Devcontainerでこのリポジトリを開きます。
flet run appでアプリケーションを起動します。(Linuxアプリとして起動します。Webブラウザでも表示することができるのでそちらも活用してください。--web)
※ WSLの場合、WSLのGUIを有効にする必要がある場合があります。トラブルシューティングは公式サイトを参照してください。
- このリポジトリをクローンします。
poetry installorpip install -r requirements.txtで必要なライブラリをインストールします。flet run appでアプリケーションを起動します。