반응형

Stable Diffusion 속 CFG scale 설정은 AI 이미지를 생성 시 얼마나 Prompt를 충실히 이해하고 입력하는지를 나타내는 값입니다. CFG sacle 설정을 통하여 프롬프트로 얼마나 강력하게 제어해서 AI 이미지를 만들어 낼지 정할 수 있습니다. 대부분의 스테이블 디퓨전 속 CFG scale 은 7로 설정되어있고 대부분의 작업물에 7은 안전하고 그리고 prompt를 어느 정도 따라 가게 할 수 있는 범위입니다. prompt가 얼마나 상세히 설정되었는지 또는 얼마나 AI가 이해하기 쉽게 입력이 되어있는지에 따라 범위를 늘리고 줄이고 하면서 설정할 필요가 있는 값입니다.

 

How to: Stable diffusion CFG Scale

1. 스테이블 디퓨전의 CFG scale 값을 이해하기 위해서는 prompt 및 여러 값들은 전부 고정 후 CFG scale 값만 변경해서 이미지를 생성해보시는 게 이해하시기 편합니다.

2. 아래에는 이해 하시기 편하게 CFG 값을 제외한 모든 설정을 동일하게 고정 후 generate 된 이미지들입니다.

이미지는 클릭하시면 크게 보실 수 있습니다.

CFG Scale - 1 CFG Scale - 7 CFG Scale - 13 CFG Scale - 20 CFG Scale - 26 CFG Scale - 30

 위의 사진들은 전부 같은 seed 값과 설정값 그리고 똑같은 프롬프트를 가지고 CFG scale 값에만 변화를 주어 생성한 이미지입니다. 사용된 Prompt에는 (A cute girl standing in front of a house), (Lucxery expensive house), (A pool next to the house), masterpiece, best quality, light sky-blue eyes, red lips, 8k, detailed, detailed texture, 로 입력 하였습니다. 하지만 위의 사진들과 같이 CFG Sacle에 따라 사진의 결과물이 천차만별로 나오는 것을 알 수 있습니다.

 

Stable diffusion CFG Scale에 따른 사진 결과

1.CFG Scale - 1의 경우에는 사진 속 주체가 되는 main object를 제외한 다른 물건들은 기괴하거나 완성되지 않는 모습으로 나오는 것을 확인하실 수 있습니다. 이 경우에는 AI가 Prompt를 제대로 이해 하기 위해 여러번 생각을 하지 않는 상태로 생성된 이미지 입니다. 말 그대로 prompt가 재대로 적용되지 않는 모습을 보여줍니다.

2. CFG Scale - 7의 경우에는 주 메인 오브젝트를 제외한 나머지 사물들도 꽤 정교하게 만들어졌습니다. CFG Sacle 7 이상부터는 기본 defualt 값으로 설정되어있는 만큼, 기대하는 최소치의 퀄리티를 제공해주고 있습니다. 입력된 prompt 도 대부분 나오며 나쁘지 않은 결과 물을 보여 줍니다.

3. CFG Scale - 13의 경우에는 7보다 조금 더 prompt에 가깝게 만들어지며 조금 더 현실에 가깝게 제작됩니다. 빛에 관련된 내용이 추가로 들어가면 빛 반사 또는 빛의 방향을 계산해서 만들어 주고 이미지의 깊이 감도 추가로 늘려줍니다. 제일 중요한 점은 Prompt가 제대로 입력되었다는 가정 하에 제작되면 최고치를 뽑아낼 수 있는 값으로 생각됩니다.

4. CFG Scale - from 20 to 30의 경우에는 사용의 거의 불가능하다고 생각됩니다. 이유로는 여러 가지가 있겠지만, 생성된 AI 이미지 결과물이 너무 기괴하고 현실적이지 않다는 이유가 있습니다. 이 단계의 값부터는 Prompt가 AI를 위한 단어들을 사용해야 되며 감정를 배제한 단어로 사용 해야되며 명확한 단어만 사용되어야 합니다. 

반응형
반응형

스테이블 디퓨전 한방에 설치해 보자

 stable diffusion 설치는 처음 하는 사람들에게는 엄청 복잡해 보인다. GiHub에 들어가서 Automatic1111, stable diffusion webui를 설치해서 파이썬은 어떻게 하고 등등에 많은 조건들이 필요하다고 한다. 하지만 단순이 스테이블 디퓨전을 설치해서 이미지를 생성하고 싶은 사람들에게는 위의 내용은 크게 확인할 필요가 없는 내용들이다. 여러 가지 조건들은 extension을 추가로 넣고 여러 편의 기능을 추가했을 때 정상 작동을 위한 준비물이기 때문이다.

 

스테이블 디퓨전 설치

1. 엔비디아 그래픽 카드를 사용하고 있을 경우, https://github.com/AUTOMATIC1111/stable-diffusion-webui/releases/tag/v1.0.0-pre 옆의 공식 stable dfussion 설치 링크로 간다. 

2. sd.webui.zip 파일을 클릭해서 다운로드한다.

3. 압축 해제 후 폴더 안의 update.bat 파일을 클릭한다. CMD 명령 창이 뜨며 여러 가지 업데이트가 진행된다. 가만히 놔두면 알아서 되니 끝날 때까지 인내심을 가지고 기다린다.

4. 업데이트가 완료되면 CMD 명령 창을 끄고 폴더 안의 run.bat 파일을 더블 클릭한다. 똑같이 CMD 명령 창이 뜨며 필수 내용 등을 자동 설치 한다. 여기까지 오면 거의 설치가 완료되었다. 아무 문제 없이 설치가 제대로 되었다면 웹사이트 형식의 UI 가 뜨며 이제 이미지를 생성할 수 있게 되었다.

5. 만약 웹사이트 형식의 UI가 뜨지 않고 에러가 나온다면 다시 폴더로 돌아가 3번 스텝부터 다시 한번 더 진행하면 된다.

 

실행 후 여러 가지 발생 가능한 문재점

1. 컴퓨터에 스테이블 디퓨전을 설치 전 파이썬을 깔았던 내용이 있다면 반듯이 파이썬 3.10.6 버전 이하로 재설치를 해야 된다 이유는 그 이상의 최신 버전은 지원을 하지 않기 때문에 충돌이 일어날 확률이 매우 높다. 그리고 파이썬 설치 시 "Add Python to PATH"를 물어보는 경우가 있는데 이것 또한 반듯이 체크해 놓아야 문재가 없다.

2. 그래픽 카드가 너무 구형이면 작동이 불가능할 수도 있다. 엔비디아 그래픽 기준 1060 이하로 내려가게 되면 실행이 불가능하거나 되더라도 이미지 한 장 생성하는데 분 단위의 시간이 필요해질 수도 있기 때문에 stable diffusion의 사용 의미가 없어질 수도 있다.

 

결론

위의 내용대로 stable diffusion을 설치하게 되면 아주 기본적인 이미지 생성을 할 수 있게 된다. 다만 파이썬의 설치 그리고 Github 설치등을 하지 않았으므로 extension 설치 시 정상 작동 또는 편의성이 떨어질 확률이 매우 높다. 하지만 promt를 넣고 이미지를 생성하기에는 위의 내용으로도 충분하다고 생각한다.

반응형

+ Recent posts