반응형

Stable Diffusion 속 CFG scale 설정은 AI 이미지를 생성 시 얼마나 Prompt를 충실히 이해하고 입력하는지를 나타내는 값입니다. CFG sacle 설정을 통하여 프롬프트로 얼마나 강력하게 제어해서 AI 이미지를 만들어 낼지 정할 수 있습니다. 대부분의 스테이블 디퓨전 속 CFG scale 은 7로 설정되어있고 대부분의 작업물에 7은 안전하고 그리고 prompt를 어느 정도 따라 가게 할 수 있는 범위입니다. prompt가 얼마나 상세히 설정되었는지 또는 얼마나 AI가 이해하기 쉽게 입력이 되어있는지에 따라 범위를 늘리고 줄이고 하면서 설정할 필요가 있는 값입니다.

 

How to: Stable diffusion CFG Scale

1. 스테이블 디퓨전의 CFG scale 값을 이해하기 위해서는 prompt 및 여러 값들은 전부 고정 후 CFG scale 값만 변경해서 이미지를 생성해보시는 게 이해하시기 편합니다.

2. 아래에는 이해 하시기 편하게 CFG 값을 제외한 모든 설정을 동일하게 고정 후 generate 된 이미지들입니다.

이미지는 클릭하시면 크게 보실 수 있습니다.

CFG Scale - 1 CFG Scale - 7 CFG Scale - 13 CFG Scale - 20 CFG Scale - 26 CFG Scale - 30

 위의 사진들은 전부 같은 seed 값과 설정값 그리고 똑같은 프롬프트를 가지고 CFG scale 값에만 변화를 주어 생성한 이미지입니다. 사용된 Prompt에는 (A cute girl standing in front of a house), (Lucxery expensive house), (A pool next to the house), masterpiece, best quality, light sky-blue eyes, red lips, 8k, detailed, detailed texture, 로 입력 하였습니다. 하지만 위의 사진들과 같이 CFG Sacle에 따라 사진의 결과물이 천차만별로 나오는 것을 알 수 있습니다.

 

Stable diffusion CFG Scale에 따른 사진 결과

1.CFG Scale - 1의 경우에는 사진 속 주체가 되는 main object를 제외한 다른 물건들은 기괴하거나 완성되지 않는 모습으로 나오는 것을 확인하실 수 있습니다. 이 경우에는 AI가 Prompt를 제대로 이해 하기 위해 여러번 생각을 하지 않는 상태로 생성된 이미지 입니다. 말 그대로 prompt가 재대로 적용되지 않는 모습을 보여줍니다.

2. CFG Scale - 7의 경우에는 주 메인 오브젝트를 제외한 나머지 사물들도 꽤 정교하게 만들어졌습니다. CFG Sacle 7 이상부터는 기본 defualt 값으로 설정되어있는 만큼, 기대하는 최소치의 퀄리티를 제공해주고 있습니다. 입력된 prompt 도 대부분 나오며 나쁘지 않은 결과 물을 보여 줍니다.

3. CFG Scale - 13의 경우에는 7보다 조금 더 prompt에 가깝게 만들어지며 조금 더 현실에 가깝게 제작됩니다. 빛에 관련된 내용이 추가로 들어가면 빛 반사 또는 빛의 방향을 계산해서 만들어 주고 이미지의 깊이 감도 추가로 늘려줍니다. 제일 중요한 점은 Prompt가 제대로 입력되었다는 가정 하에 제작되면 최고치를 뽑아낼 수 있는 값으로 생각됩니다.

4. CFG Scale - from 20 to 30의 경우에는 사용의 거의 불가능하다고 생각됩니다. 이유로는 여러 가지가 있겠지만, 생성된 AI 이미지 결과물이 너무 기괴하고 현실적이지 않다는 이유가 있습니다. 이 단계의 값부터는 Prompt가 AI를 위한 단어들을 사용해야 되며 감정를 배제한 단어로 사용 해야되며 명확한 단어만 사용되어야 합니다. 

반응형

+ Recent posts