loading
반응형

Web.World/Ai.ML.SD 44

NVIDIA, PC에서 실행되는 맞춤형 AI, Chat with RTX 무료 출시

NVIDIA에서 PC의 로컬 데이터를 활용해 개인화된 AI 챗봇을 만들 수 이는 툴인 Chat with RTX를 출시했습니다. Geforce RTX 30/40 시리즈(최소 VRAM 8GB 이상)에서 무료로 사용할 수 있다고 합니다. RGA(Retrieval-Augmented Generaion) 외에 NVIDIA TensorRT-LLM과 RTX 가속을 활용해 AI 기능을 구현한다고 하며, 로컬로 동작하기에 민감한 정보 유출 등의 걱정이 없다고 합니다. ----- 와...실시간 오프라인 NPC 제작(.....;) 가능하네요.

Web.World/Ai.ML.SD 2024.02.14

Google One 요금제, AI 프리미엄 추가

Google의 Gemini Advanced 를 지원하는 요금제가 갱신되었습니다. AI 프리미엄 구독의 경우 29,000원/월의 가격이 2TB의 스토리지, AI 기능 등을 포함하는 걸 감안하면 상당히 매력적인 가격이지 않나 싶네요. 오피스를 제공하긴 하지만 MS의 코파일럿보다 조금 더 저렴하고, OpenAI 제품에 비하면 클라우드 기능 등의 추가 기능이 제공되는 만큼 매력적인 가격대라 생각되네요. ----- 개인적으론 구글의 서비스를 주력으로 사용하고 있는 만큼 기대가 큽니다. 다만 아직 그림을 그려주지는 못하네요.

Web.World/Ai.ML.SD 2024.02.10

AI 펫, LOONA, EMO

검색엔진에서 AI Robot PET이라 검색하면 제일 먼저, 그리고 가장 많이 나오는 제품. 알리에서 검색하면 좀 더 많은 종류를 찾을 수 있다. LOONA, EMO 제조사에서도 또다른 신규 제품 개발중인 듯 하고. LG에서도 뭔가 준비중인듯. EMO, LOONA 모두 한화 약 EMO는 30만원, LOONA는 60만원 정도. 현재 할인행사 중인듯 하다. 반겨주고, 쓰다듬어 주고, 사진 찍고, 음악에 반응하고, 불도 켜고, 말도 알아듣고, 알람도 해주고, 그러면서도 귀엽다. 근데 아직 배터리 러닝 타임이 좀 아쉽다. 영어로만 알아듣는 것도 조금 아쉽고. 한국어 잘 알아듣는 귀여운 제품이 좀 더 빨리 출시면 좋겠다....

Web.World/Ai.ML.SD 2024.01.26

RTX4090 조합으로 초당 100장의 그림을 그리는 StreamDiffusion

초당 100장에 달하는 이미지를 그려낼 수 있는 AI StreamDiffusion이 개발되었다고 합니다. Core i9-13900K, RTX4090, Ubuntu 22.04.3LTS를 사용해 SD-Turbo기반으로 제작되었다고 하네요. 설정에 따라 차이는 있지만 img2img에서 90프레임~30프레임을 초당 뽑아낼 수 있었다고 합니다. 계산 중복성 최소화, 일괄 처리, 유사도 필터링으로 GPU 사용률 극대화, 모델 최적화 등을 적용했다고 하며 GitHub에 설치 방법 등도 공개되어있다고 합니다.

Web.World/Ai.ML.SD 2023.12.25

Google, Gemini 공개

Google이 자사의 차세대 AI, Gemini를 공개했습니다. 바드보다 멀티모달 처리 성능이 향상되어 텍스만이 아니라 영상, 이미지, 코드 등의 정보를 종합적으로 판단해 대답할 수 있게 되었다고 합니다. 관련 블로그 및 유튜브 등에서 확인할 수 있습니다. 바드가 Gemini 기반으로 업데이트(지금은 영문만 가능하네요) 되었다고 하며, 바드에서 제미니를 사용해볼 수 있다고 하며, 내년 초 Gemini Ultra를 사용할 수 있을 것이라고 합니다.

Web.World/Ai.ML.SD 2023.12.09

텍스트에서 실시간 AI 이미지를 생성하는 SDXL Turbo

Stability.ai에서 실시간으로 텍스트에서 이미지를 생성하는 AI 모델인 SDXL Turbo를 발표했습니다. SDXL 1.0을 기반으로 하며, ADD(Adversarial Diffusion Disillation)이라는 새로운 기술을 사용한다고 합니다. 단일 이미지 생성의 성능과 속도를 크게 향상시킨 SDXL이며, Clipdrop에서 테스트해볼 수 있다고 하며, 비상업적 연구 용도로만 사용할 수 있다고 합니다.

Web.World/Ai.ML.SD 2023.11.29

아마존, 비지니스용 대화형 AI, Amazon Q 발표

아마존이 기업용 대화형 AI, Amazon Q를 발표했습니다. 이 챗봇은 고객의 정보 저장소, 코드, 데이터 및 기업과 연결되어 회사에 필요한 답변을 제공한다고 합니다. 사용자당 사용료는 비지니스 플랜 기준 월 $20정도라고 하네요. 기업용 대화형AI답게 직책에 맞춘 상호작용과 더불어 관리자가 컨텍스트 정의를 설정할 수 있다고 합니다. 또한 AI 모델 훈련에 고객의 정보를 활용하지 않아 보안 유지도 된다고 하고요.

Web.World/Ai.ML.SD 2023.11.29

텍스트로 음악을 생성하는 서비스, Stable Audio 출시

Stable AI에서 텍스트로 음악이나 소리를 만들어내는 Stable Audio를 발표했습니다. 여기서 사용가능합니다. latent diffusion 모델을 사용하는 서비스이며, 44.1kHz의 음악을 생성할 수 있다고 합니다. 상업적 이용과 90초 가량의 음악 생성이 가능한 Pro 구독을 준비중이라고 하고, 무료로는 최대 20초 정도의 음악을 생성해준다고 합니다.

Web.World/Ai.ML.SD 2023.09.14

AI 보이스(국내) 업체 이용하기

생각보다 가격이 되게 비싸거나 하진 않는데, 이걸 전문적으로 사용한다면 미묘하지 않나 싶음. 마이크로소프트 애저, 네이버 클로바 더빙, KT AI 보이스 등이 있는 듯하다. 각종 클라우드 기반 서비스를 제공하는 업체나 전문 업체들도 관련 서비스를 제공하고 있다. 예를 들면 프로소디, 타입캐스트, 구글, 아마존, 카카오, IBM 등에서도 TTS 서비스는 제공하는데 무료 제공하는 업체는 차이는 좀 있는 편. 개인적으론 MS 애져가 되게 만족도가 높았음. 반응 속도도 빠른 편이고. 약관 잘 읽어보고, 필요에 따라 이리저리 사용하면 되지 않나 싶다. 개인적으로 기본 발음에서 가장 어색함이 적었던 건 클로바고, 설정을 해도 비교적 위화감이 적게 우리말로 만들어지는 건 MS 애져였다. 앞으로도 국내 AI 보이스 업..

Web.World/Ai.ML.SD 2023.09.14

SDXL 윈도용 실행기, Fooocus

SDXL을 사용하는 방법은 여러가지가 있지만, SDXL용 Fooocus가 이번에 출시되었습니다. 아마 가장 대중적인건 아직 AUTOMATIC1111의 Web-ui가 아닐까 싶네요. 이 외에도 StableSwarmUI, ComfyUI 등이 있는데, 이번에 Lvmin Zhang이 제작한 Fooocus가 출시되어 관련 기사 확인겸 포스팅 해봅니다. 유튭 등에서도 이미 꽤나 인기있네요. Fooocus는 SDXL전용이며, 깃헙은 여기입니다. 받아서 압축풀고 run.bat실행하면 됩니다. CUDA를 지원하는 NVIDIA 그래픽 카드가 필요하다고 합니다(VRAM 4GB이상, 시스템 메모리 8GB 이상), 아직 AMD Radeon, Intel Arc, Mac M1/M2는 지원하지 않는다고 합니다(지원 예정은 있다고)...

Web.World/Ai.ML.SD 2023.08.16
반응형