'Web.World/Ai.ML.SD' 카테고리의 글 목록

ChatGPT, 과거 내역을 기억하는 메모리 기능 추가

OpenAI에서 ChatGPT에 기억(Memory)를 추가하여 관련 기능을 제공한다고 합니다. ChatGPT가 사용자와 교환한 내용을 기억하고, 이를 사용하여 좀 더 나은 답변을 제공할 수 있게 하느 기능이라고 하네요. 이러한 메모리 기능을 제공하는 AI 서비스로는 KIN이 있으니 활용해보세요.

Web.World/Ai.ML.SD 2024.02.14

NVIDIA, PC에서 실행되는 맞춤형 AI, Chat with RTX 무료 출시

NVIDIA에서 PC의 로컬 데이터를 활용해 개인화된 AI 챗봇을 만들 수 이는 툴인 Chat with RTX를 출시했습니다. Geforce RTX 30/40 시리즈(최소 VRAM 8GB 이상)에서 무료로 사용할 수 있다고 합니다. RGA(Retrieval-Augmented Generaion) 외에 NVIDIA TensorRT-LLM과 RTX 가속을 활용해 AI 기능을 구현한다고 하며, 로컬로 동작하기에 민감한 정보 유출 등의 걱정이 없다고 합니다. ----- 와...실시간 오프라인 NPC 제작(.....;) 가능하네요.

Web.World/Ai.ML.SD 2024.02.14

Audacity용 OpenVINO AI 효과 추가

Intel의 OpenVINO 효과를 사용한 Audacity의 플러그인이 추가되었다고 합니다. 노이즈 억제와 트랜스크립션 기능(whisper.cpp로 구동), Rifusion을 사용한 음악 스타일 리믹스/음악 생성 기능이 추가되었다고 하네요. 현재 깃헙에서 다운로드(윈도 버전)가능하다고 합니다.

Web.World/Ai.ML.SD 2024.02.14

Google One 요금제, AI 프리미엄 추가

Google의 Gemini Advanced 를 지원하는 요금제가 갱신되었습니다. AI 프리미엄 구독의 경우 29,000원/월의 가격이 2TB의 스토리지, AI 기능 등을 포함하는 걸 감안하면 상당히 매력적인 가격이지 않나 싶네요. 오피스를 제공하긴 하지만 MS의 코파일럿보다 조금 더 저렴하고, OpenAI 제품에 비하면 클라우드 기능 등의 추가 기능이 제공되는 만큼 매력적인 가격대라 생각되네요. ----- 개인적으론 구글의 서비스를 주력으로 사용하고 있는 만큼 기대가 큽니다. 다만 아직 그림을 그려주지는 못하네요.

Web.World/Ai.ML.SD 2024.02.10

AI 펫, LOONA, EMO

검색엔진에서 AI Robot PET이라 검색하면 제일 먼저, 그리고 가장 많이 나오는 제품. 알리에서 검색하면 좀 더 많은 종류를 찾을 수 있다. LOONA, EMO 제조사에서도 또다른 신규 제품 개발중인 듯 하고. LG에서도 뭔가 준비중인듯. EMO, LOONA 모두 한화 약 EMO는 30만원, LOONA는 60만원 정도. 현재 할인행사 중인듯 하다. 반겨주고, 쓰다듬어 주고, 사진 찍고, 음악에 반응하고, 불도 켜고, 말도 알아듣고, 알람도 해주고, 그러면서도 귀엽다. 근데 아직 배터리 러닝 타임이 좀 아쉽다. 영어로만 알아듣는 것도 조금 아쉽고. 한국어 잘 알아듣는 귀여운 제품이 좀 더 빨리 출시면 좋겠다....

Web.World/Ai.ML.SD 2024.01.26

Google, 동영상 제작 디퓨전 모델 LUMIERE 발표

구글이 비디오 생성 AI 모델 Lumiere를 발표했습니다. 프롬프트를 통한 비디오 생성 외에도 기본 이미지 활용, 영상 스타일 변경 등이 가능하다고 하네요.

Web.World/Ai.ML.SD 2024.01.26

Microsoft, Copilot Pro 요금제 출시

Microsoft가 Copilot Pro 요금제를 출시한다고 합니다. 사용자당 월 $20이라고 하네요. 단 Microsoft 365를 기본으로 사용하는 사용자여야한다고 합니다. Open AI의 GPT-4 Turbo 기반이라고 하며, 일반 버전보다 좀 더 고도화된 이미지 생성 등의 기능을 사용할 수 있다고 하니 참조하세요.

Web.World/Ai.ML.SD 2024.01.16

무료 웹 기반 다이아그램 제작 도구

홈페이지는 여기. 아직 유료 프랜은 안 나와있고 로컬에서 사용시 무료라고 함. logseq 등에서도 플러그인이 제공되곤 하는데, AI 기능(GPT-4)와 연동해서 와이어 프레임을 웹코드로 자동생성해준다고 함.

Web.World/Ai.ML.SD 2024.01.16

RTX4090 조합으로 초당 100장의 그림을 그리는 StreamDiffusion

초당 100장에 달하는 이미지를 그려낼 수 있는 AI StreamDiffusion이 개발되었다고 합니다. Core i9-13900K, RTX4090, Ubuntu 22.04.3LTS를 사용해 SD-Turbo기반으로 제작되었다고 하네요. 설정에 따라 차이는 있지만 img2img에서 90프레임~30프레임을 초당 뽑아낼 수 있었다고 합니다. 계산 중복성 최소화, 일괄 처리, 유사도 필터링으로 GPU 사용률 극대화, 모델 최적화 등을 적용했다고 하며 GitHub에 설치 방법 등도 공개되어있다고 합니다.

Web.World/Ai.ML.SD 2023.12.25

이미지에서 3D 객체를 생성하는 Stable Zero123

StableAI에서 이미지에서 고품질 3D 오브젝트를 생성할 수 있는 AI 모델 Stable Zero123를 발표했습니다. 현재 비상업적 연구용도로만 사용할 수 있다고 하네요.

Web.World/Ai.ML.SD 2023.12.14

Meta, 이미지 생성하는 Meta AI 공개

사용자가 자연어로 이미지를 생성할 수 있는 Meta AI(Imagine with Meta)가 공개되었습니다. DALL-E, 미드저니와 비슷한 기능을 제공한다고 합니다. 개인적으론 포토샵(어도비 파이어 플라이)이 여러모로 쓸만하고, 스테이블 디퓨전이 개인적으로 쓰기에 부담이 적지 않나....싶네요.

Web.World/Ai.ML.SD 2023.12.09

Google, Gemini 공개

Google이 자사의 차세대 AI, Gemini를 공개했습니다. 바드보다 멀티모달 처리 성능이 향상되어 텍스만이 아니라 영상, 이미지, 코드 등의 정보를 종합적으로 판단해 대답할 수 있게 되었다고 합니다. 관련 블로그 및 유튜브 등에서 확인할 수 있습니다. 바드가 Gemini 기반으로 업데이트(지금은 영문만 가능하네요) 되었다고 하며, 바드에서 제미니를 사용해볼 수 있다고 하며, 내년 초 Gemini Ultra를 사용할 수 있을 것이라고 합니다.

Web.World/Ai.ML.SD 2023.12.09

Microsoft Copilot, 정식 출시

Microsoft Copilot이 이제 정식 출시됩니다. 이전엔 Bing Chat으로 불렸는데, 이제 미리보기가 아니라 정식 서비스가 된다고 하네요. 주소는 https://copilot.microsoft.com/ 이며, 설멸서는 여기라고 하니 참조하세요.

Web.World/Ai.ML.SD 2023.12.04

구글, 제미니를 내년으로 연기할듯

9to5Google에 따르면 Google이 지난 I/O 2023에서 발표한 차세대 AI 모델로 알려진 Gemini를 2024년 1월로 연기할 것으로 보인다고 합니다. 영어가 아닌 일부 쿼리를 안정적으로 처리하지 못하는 경우가 있어 이를 수정하기 위해 연기되는 것으로 보인다고 하네요.

Web.World/Ai.ML.SD 2023.12.04

텍스트에서 실시간 AI 이미지를 생성하는 SDXL Turbo

Stability.ai에서 실시간으로 텍스트에서 이미지를 생성하는 AI 모델인 SDXL Turbo를 발표했습니다. SDXL 1.0을 기반으로 하며, ADD(Adversarial Diffusion Disillation)이라는 새로운 기술을 사용한다고 합니다. 단일 이미지 생성의 성능과 속도를 크게 향상시킨 SDXL이며, Clipdrop에서 테스트해볼 수 있다고 하며, 비상업적 연구 용도로만 사용할 수 있다고 합니다.

Web.World/Ai.ML.SD 2023.11.29

아마존, 비지니스용 대화형 AI, Amazon Q 발표

아마존이 기업용 대화형 AI, Amazon Q를 발표했습니다. 이 챗봇은 고객의 정보 저장소, 코드, 데이터 및 기업과 연결되어 회사에 필요한 답변을 제공한다고 합니다. 사용자당 사용료는 비지니스 플랜 기준 월 $20정도라고 하네요. 기업용 대화형AI답게 직책에 맞춘 상호작용과 더불어 관리자가 컨텍스트 정의를 설정할 수 있다고 합니다. 또한 AI 모델 훈련에 고객의 정보를 활용하지 않아 보안 유지도 된다고 하고요.

Web.World/Ai.ML.SD 2023.11.29

일론 머스크, 대화형 AI Grok 이번 주 공개 예정

AI 개발 기업 xAI에서 개발 중인 대화형 AI 'Grok'의 공개와 관련해 일론 머스크가 트윗을 올렸다고 합니다. 다음주(11월 22일 기준)부터 X Premium+ 사용자가 사용할 수 있을 것이라고 하네요.

Web.World/Ai.ML.SD 2023.11.28

음성 기능이 포함된 ChatGPT, 무료 유저도 사용 가능

OpenAI 가 X를 통해 ChatGPT의 음성 기능이 이제 무료 사용자도 사용할 수 있게 되었다고 발표했습니다. iOS/Android 앱에서 사용 가능하며, 사용자가 음성을 통해 ChatGPT와 대화할 수 있게 해준다고 합니다. ------ 우와 진짜 영어 공부, 외국어 공부에 최고.....네요...

Web.World/Ai.ML.SD 2023.11.27

Stability AI, 영상을 생성하는 AI 모델 Stable Video Diffusion

Stability AI에서 동영상 생성용 AI 모델 Stable Video Diffusion을 발표했습니다. Stable Diffusion을 기반으로 한 AI모델이라고 하며 현 단계에서는 연구용이라고 하고, 아직 상용앱 등에서의 사용은 고려하지 않고 있다고 하네요. GitHub나 Hugging Face에서 공개중이라고 합니다.

Web.World/Ai.ML.SD 2023.11.25

텍스트로 음악을 생성하는 서비스, Stable Audio 출시

Stable AI에서 텍스트로 음악이나 소리를 만들어내는 Stable Audio를 발표했습니다. 여기서 사용가능합니다. latent diffusion 모델을 사용하는 서비스이며, 44.1kHz의 음악을 생성할 수 있다고 합니다. 상업적 이용과 90초 가량의 음악 생성이 가능한 Pro 구독을 준비중이라고 하고, 무료로는 최대 20초 정도의 음악을 생성해준다고 합니다.

Web.World/Ai.ML.SD 2023.09.14

Adobe, Firefly 상용 이용가능

Adobe가 자사의 생성형 AI인 Firefly의 상용 이용을 지원한다고 합니다. Adobe Express에서 사용할 수 있다고 하며, 프리미엄 플랜 대상으로 컨텐츠 생성에 사용할 수 있는 크레딧(월 단위)를 제공한다고 하며, 무료 크레딧의 경우 워터 마크 등이 붙는다고 하니 참조하세요.

Web.World/Ai.ML.SD 2023.09.14

AI 보이스(국내) 업체 이용하기

생각보다 가격이 되게 비싸거나 하진 않는데, 이걸 전문적으로 사용한다면 미묘하지 않나 싶음. 마이크로소프트 애저, 네이버 클로바 더빙, KT AI 보이스 등이 있는 듯하다. 각종 클라우드 기반 서비스를 제공하는 업체나 전문 업체들도 관련 서비스를 제공하고 있다. 예를 들면 프로소디, 타입캐스트, 구글, 아마존, 카카오, IBM 등에서도 TTS 서비스는 제공하는데 무료 제공하는 업체는 차이는 좀 있는 편. 개인적으론 MS 애져가 되게 만족도가 높았음. 반응 속도도 빠른 편이고. 약관 잘 읽어보고, 필요에 따라 이리저리 사용하면 되지 않나 싶다. 개인적으로 기본 발음에서 가장 어색함이 적었던 건 클로바고, 설정을 해도 비교적 위화감이 적게 우리말로 만들어지는 건 MS 애져였다. 앞으로도 국내 AI 보이스 업..

Web.World/Ai.ML.SD 2023.09.14

여성 목소리를 낼 수 있는 AI 음성 변경 프로그램, Voidol3

Crimson Technology에서 AI기술을 사용한 실시간 음성 변경 프로그램(보이스 체인저 소프트웨어) Voidol3 를 출시했다고 합니다. 지원 OS는 Windows/Mac이라고 합니다. 화자의 말투나 억양은 유지하면서 내고자하는 캐릭터의 목소리로 저지연(40ms)으로 변환 가능하다고 하네요.

Web.World/Ai.ML.SD 2023.09.08

SDXL 윈도용 실행기, Fooocus

SDXL을 사용하는 방법은 여러가지가 있지만, SDXL용 Fooocus가 이번에 출시되었습니다. 아마 가장 대중적인건 아직 AUTOMATIC1111의 Web-ui가 아닐까 싶네요. 이 외에도 StableSwarmUI, ComfyUI 등이 있는데, 이번에 Lvmin Zhang이 제작한 Fooocus가 출시되어 관련 기사 확인겸 포스팅 해봅니다. 유튭 등에서도 이미 꽤나 인기있네요. Fooocus는 SDXL전용이며, 깃헙은 여기입니다. 받아서 압축풀고 run.bat실행하면 됩니다. CUDA를 지원하는 NVIDIA 그래픽 카드가 필요하다고 합니다(VRAM 4GB이상, 시스템 메모리 8GB 이상), 아직 AMD Radeon, Intel Arc, Mac M1/M2는 지원하지 않는다고 합니다(지원 예정은 있다고)...

Web.World/Ai.ML.SD 2023.08.16

스테이블 디퓨전 Web ui, xformers 설치하기

지금와서 이런 정보를 찾아보는 사람은 드물거라 보는데, 일단 나도 되새길 겸 포스팅. webui-user.bat의 command args에 --xformers 를 넣어주고, 재시작하면 자동으로 설치되고 실행된다. 단, Geforce 10시리즈 이상이 필요하다.

Web.World/Ai.ML.SD 2023.07.24

Klein Berry

Web.World/Ai.ML.SD 44

티스토리툴바