Meta가 SAM(Segment Anything Model) Audio를 공개했습니다. 배경 소리와 음성 및 지정 효과를 분리 및 추출하고, 음악에서 악기고 분리할 수 있다고 하네요. 다양한 소리가 혼합된 현실에서 녹음된 소리를 사용해 내용을 좀 더 명확히 확인하는게 가능해지겠네요.
깃헙에서 저장소 복제 등으로 사용해보시거나 메타의 플레이그라운드에서 사용해볼 수 있습니다. 다만 전체적인 음질이 조금 열화되는 건 아쉽네요. 목소리 분리는 충분히 좋아서 보청기 등에 유용할 것 같습니다. 좋아요...