loading
반응형

Web.World/Ai.ML.SD 48

AI 보이스(국내) 업체 이용하기

생각보다 가격이 되게 비싸거나 하진 않는데, 이걸 전문적으로 사용한다면 미묘하지 않나 싶음. 마이크로소프트 애저, 네이버 클로바 더빙, KT AI 보이스 등이 있는 듯하다. 각종 클라우드 기반 서비스를 제공하는 업체나 전문 업체들도 관련 서비스를 제공하고 있다. 예를 들면 프로소디, 타입캐스트, 구글, 아마존, 카카오, IBM 등에서도 TTS 서비스는 제공하는데 무료 제공하는 업체는 차이는 좀 있는 편. 개인적으론 MS 애져가 되게 만족도가 높았음. 반응 속도도 빠른 편이고. 약관 잘 읽어보고, 필요에 따라 이리저리 사용하면 되지 않나 싶다. 개인적으로 기본 발음에서 가장 어색함이 적었던 건 클로바고, 설정을 해도 비교적 위화감이 적게 우리말로 만들어지는 건 MS 애져였다. 앞으로도 국내 AI 보이스 업..

Web.World/Ai.ML.SD 2023.09.14

SDXL 윈도용 실행기, Fooocus

SDXL을 사용하는 방법은 여러가지가 있지만, SDXL용 Fooocus가 이번에 출시되었습니다. 아마 가장 대중적인건 아직 AUTOMATIC1111의 Web-ui가 아닐까 싶네요. 이 외에도 StableSwarmUI, ComfyUI 등이 있는데, 이번에 Lvmin Zhang이 제작한 Fooocus가 출시되어 관련 기사 확인겸 포스팅 해봅니다. 유튭 등에서도 이미 꽤나 인기있네요. Fooocus는 SDXL전용이며, 깃헙은 여기입니다. 받아서 압축풀고 run.bat실행하면 됩니다. CUDA를 지원하는 NVIDIA 그래픽 카드가 필요하다고 합니다(VRAM 4GB이상, 시스템 메모리 8GB 이상), 아직 AMD Radeon, Intel Arc, Mac M1/M2는 지원하지 않는다고 합니다(지원 예정은 있다고)...

Web.World/Ai.ML.SD 2023.08.16

ComfyUI 사용하기(AMD 글카)

지나가시던 고마운 분이 윈도+라데온 조합에는 이게 더 쉽다고 하길래 시간 나서 찾아봄. 해보니까 쉽지는...않은 것 같다. 사용법은 간단하다. 폴더 만들고 > 레포지터리 복사하고(또는 master에서 zip으로 받아도 무방), 파이선은 3.10 설치해두고, path 넣어주도록 합시다. SDXL용 Styler는 여기. 곧 나올 SDXL도 지원한다고 하는데 나한텐 아직 익숙하지가 않네; 아무튼 설치법은 설치할 폴더 만들고 git bash 띄우고 git clone 으로 하던지, 아니면 Github에서 파일 받아서( Code 부분 누르면 Download Zip있음) 압축풀어둔 뒤에 미리 모델(ckpt, safetoensors)을 models/checkpints에 넣어두고, VAE 역시 models/vae에 넣어..

Web.World/Ai.ML.SD 2023.07.17

AMD 글카에서 스테이블 디퓨전 사용하기

ComfyUI는 AMD글카 사용시 리눅스...를 요구하고, 대게 우분투같은 거 설치해서 돌리는 게 좀 더 편한한 옵션이고, 윈도에서 구동하려면 사실 NVIDIA 글카 하나 구매하는 게 여러모로 편하지 않나 싶음. 아님 그냥 Google Colab + Google Drive를 월별 구매해서 쓰는게 생각보다 가성비 좋은 선택이기도 하지 않나 싶고. RX6000/7000 시리즈의 경우 경쟁사 대비 비교적 저렴한 가격에 넉넉한 VRAM과 성능이 있는데 이부분에서 조금 아쉬운 부분. 기능이 100% 구현되는 건 아니지만(학습 불가능) 이미지 생성 등의 대부분의 기능이 사용가능하다는 directml 버전(아직까지 유지 보수가 되는)을 설치해서 사용하는 방법밖에 없지 않나 싶다. 내가 참조한 윈도 설치 버전은 여러가..

Web.World/Ai.ML.SD 2023.07.13

스테이블 디퓨전 실사 모델 추천 2개

이리저리 해보고, 아니 이거 모델만 받아서 테스트해봐도 수백기가는 우습네; SSD 2TB 사용이 이렇게 되는구나... 글카 가격만 좀 더 떨어지면 좋을 듯; 관련정보는 미디엄 등에서도 쉽게 구할 수 있고, 구글링해도 나오고, 유튭에도 나온다. 내 생각 정리겸 포스팅. 스테이블 디퓨전 사용법 자체는 허깅페이스등에서도 얻을 수 있고, 이건 구글링만 해봐도 국내 유저들이 써놓은 거 많으니까 그거부터 차근히 읽어봅시다. 여러 모델 중에서 많이 사용하는 건 3개 정도인 듯 하다(Civitai 가입 필요). Chilloutmix - { https://civitai.com/models/6424/chilloutmix } // Remix : 가장 많이 쓰이는 모델, 뭔가 이쁘장한 동양 사람 모습. 초보자라면 이지네거티브..

Web.World/Ai.ML.SD 2023.07.13

스테이블 디퓨전 XL, 0.9 출시, 구도의 상세도 대폭 개선 등

Stability AI에서 Stable Diffusion XL 0.9(SDXL 0.9)를 발표했습니다. 이전에 발표했던 베타버전의 후속 버전이자, 화상 구도의 상세도가 대폭 개선되었다고 합니다. 7월 중 1.0 버전으로 오픈 릴리즈 예정이라고 하네요. 지원 PC환경은 16GB이상의 메모리, 최소 8GB의 VRAM이 있는 Geforce 20 이후의 그래픽 카드, Windows 10/11 또는 Linux라고 합니다. Linux에선 16GB VRAM을 가진 AMD 그래픽 카드에서도 사용할 수 있다고 하네요.

Web.World/Ai.ML.SD 2023.06.25

스테이블 디퓨전을 쉽게 - Easy Diffusion

그동안 바빠서 못하다 시간이 나서; 신규UI도 있고하고해서 찾아보다가 발견함. 스테이블 디퓨전을 좀 더 손쉽게 사용할 수 있게 해준다. 이미지 확대나 이런 건 안되도 VAE, HyperNetwork사용 가능해서 이미지 생성의 재미를 손쉽게 느껴볼 수 있음. 모델은 스테이블 디퓨전과 동일하게 받아서 폴더 안에 넣어주고, 웹UI 새로고침하면 사용할 수 있다. 무엇보다 비교적 저사양에서도 사용해볼 수 있는 건 장점이라 생각함. 그래도 일정 수준의 NVIDIA 글카는 필요하다(....;)

Web.World/Ai.ML.SD 2023.05.31

Whisper-WebUI 사용하기

스테이블 디퓨전 설치하는 거 해뒀으면 딱히 해둘 것 없지 않나 싶음. FFMPEG만 받아서 압축푼 뒤, 대충 폴더 정렬해서 bin폴더를 윈도의 path에 넣어주자(검색에서 고급 시스템 설정 보기 입력 > 시스템 속성, 고급탬에서 환경 변수(N)... 클릭 > 시스템 변수(S) 부분에서 Path 찾은 뒤 편집(I) > 새로 만들기(N) 누르고 찾아보기 눌러서 bin폴더 위치 찾아주면 OK). 요구하는 파이썬 버전도 동일하다. 음성 인식 라지 모델 기준으로 VRAM 10G정도 필요하다고. 내 메인 PC는 라데온이라 이게 안되서(....) 거실 컴터로 미디엄해봤는데 2070S 정말 열일한다(....); 번역은 몇개 써봤는데 개인적으론 DeepL이 많이 나은 거 같다. 하지만 개인 PC로 이정도 할 수 있는 건..

Web.World/Ai.ML.SD 2023.05.31

오늘 뽑은 스테블 디퓨전 이미지

손 모양 나오는 건 아직 미묘하긴 하다. 내가 아직 프롬프트 쓰는 방법이 모자라서 겠지. 으으... 내 마영전 레티 생각하고 머리 색이랑 이런거 바꾸고 날개만 달아봤는데 잘 안된다. 사용한 모델은 WuXIa-Novel AI Anything어쩌구...인데 기억 잘 안남; 프롬프트는 대충 스케치한 뒤 인식하는 거 + 색상 정도 + 그리고 기본 들어가는 마스터피스(masterpiece, best quality) 어쩌구 이런거 조합. 손만 아니면 마음에 드는 구도였는데, 좀 아쉽다. 아무튼 이쁨(....). 지금의 내 능력으론 다리 껴안고 있는 모습은 만족스럽게 안나오더라. 좀 더 찾아보고 연구해봐야 할듯.

Web.World/Ai.ML.SD 2023.03.05

MPC Video Render - RTX VSR 모드 버전

MPC Video Renderer의 NVIDIA RTX Video Super Resolution을 지원하는 모드 버전이 등록되었습니다. 레딧에서 알게 되었는데요, 여기서 받으실 수 있습니다. 사용법은 동일합니다. 최신 그래픽 드라이버를 설치한 뒤, 제어판에서 VSR을 켭니다(RTX 30/40 시리즈 필요). 이후 MPC-BE와 MPC VR RTX VSR MOD를 설치하고(install_mpcvr_64.cmd 관리자 권한 실행), Reset_Settings.cmd 관리자 권한 실행, 이후 MPC-BE의 View > Options > Video에서 Video Renderer 부분을 MPC VIdeo Renderer로 바꿔주면 됩니다. 이후 MPC-VR 설정에서 텍스쳐 포맷을 8bit 정수로(기본 값이 자동)..

Web.World/Ai.ML.SD 2023.03.02

Stable Diffusion Model 다운로드 사이트

널리알려진 곳 말고도 여러 곳이 있지 않나 싶은데, 시간 날때 좀 정리하던가 해야겠다. 설치 과정은 유튜브에 잘 나와 있어서 별 어려움 없지 않나 싶다. RTX 2070S 가격 많이 떨어졌으니 이정도 글카 하나 중고로 사서 쓰면 되지 않나 싶고. 트위터 등에서도 스테이블 디퓨전으로 뽑아낸 계정 올리는 경우도 있고 하니 사용하는 법 터득은 마음먹기 나름이지 않나 싶다. 8GB정도의 저용량 VRAM용 스테블 디퓨전도 있다는데, 이것보다는 그냥 옵션등 추가해서 사용하는게 좋지 않나 싶음. xformer는 추천되는데, 이거 사용하면 미묘하게 결과가 틀어진다고 하니 참조합시다. 근데 VRAM 8GB, 12GB정도면 그냥 필수지 않나 싶다; 오렌지 믹스(OrangeMIxs), 기본 학습 모델, 1.5버전, 애니메이..

Web.World/Ai.ML.SD 2023.03.01

Google, ChatGPT와 경쟁할 대화형 AI Bard소개

Google이 AI 이니셔티브에 대한 글을 블로그에 공개했습니다. 여기에서 대화 어플리케이션용 언어 모델(LaMDA)를 사용한 대화형 AI 서비스 Bard를 테스트용으로 일부 사용자에게 출시한다고 합니다. 차후 대중에게 공개하겠다고 하고요. 최근 MS가 ChatGT를 Bing에 활용하겠다고 하는 만큼, 구글 역시 Bard를 활용한다고 하네요.

Web.World/Ai.ML.SD 2023.02.08

Jasper Art - AI 기반의 이미지 제작 사이트

웹사이트는 여기. 이미지 제작만이 아니라 키워드 최적화, 기사 정리(....)까지 해준다. 아직 한글은 미지원으로 보이지만. 이미지 제거에도불필요한 부분은 제거하고, 밤거리를 만들어야 한다던지 하는 경우에 도움이 된다. 놀라움. 앞으로 많은 AI 기반 서비스 제공 업체들이 여러 기능을 제공하지 않을까 싶은데, 여러 제공 업체를 사용해 보는 것도 좋은 방법이지 않나 싶음=)

Web.World/Ai.ML.SD 2022.12.04

ClipDrop - AI기반의 이미지 리터칭 사이트

AI기반의 이미지 제작은 이제 실생활에 쓰여도 충분할 만큼 발전해 있고, 이걸 얼마나 잘 사용하는지도 각 디자인 영역에서 중요해지지 않나 싶다. 노벨AI같은 건 이미 유명하기도 하고. 이러한 AI기반의 툴들은 디자인 어시스턴트, 라고하는 듯 하다. 포토샵은 여전히 좋은 툴이지만. 구글 검색해도 여러 사이트 들이 나오고, 원래 이런 정보는 따로 모아서 별도 블로그에 정리할까 했는데... 일단은 카테고리 하나만 해서 정리. 이번에 발견한 곳은 ClipDrop이다. 배경 제거 / 업스케일링 / 빛 추가 등 등 Gigapixel AI, Luminar AI같은 소프트웨어도 있고 페인트샵이나 포토샵에도 기능 들어가서 작업에 속도가 엄청나게 빨라지는데 약간의 크레딧을 지불하면 각종 작업에 속도를 더해줄 곳들이 많이 ..

Web.World/Ai.ML.SD 2022.12.04
반응형