Stable Diffusion é um modelo de aprendizagem profunda para transformação de texto para imagem, lançado em 2022. É utilizado principalmente para gerar imagens detalhadas através de descrições textuais que condicionam o resultado, também sendo utilizado para inpainting e outras técnicas.[1]
O Stable Diffusion implementa um modelo de difusão latente, uma espécie de rede neural generativa profunda desenvolvida pelo grupo CompVis na Universidade de Munique,[2] em conjunto com a startup Runway.[3][4] Sua implementação é fruto de uma colaboração da CompVis, Runway, e Stability AI, com apoio da EleutherAI e LAION.[5] Tanto a implementação como os pesos do modelo foram lançados como código aberto.[6]
O modelo foi lançado com licenciamento permissivo - o Stable Diffusion concede todos os direitos sobre as imagens geradas aos usuários, com a condição de que elas não sejam ilegais ou prejudiciais. O licenceamento permissivo, bem como o uso de imagens com direitos autorais para treinamento do modelo, gerou controversas relacionadas a propriedade intelectual, a criação de símbolos associados ao nazismo, e pornografia ilegal..[4][7] Alguns artistas[8] e empresas abriram processos judiciais contra a Stability AI por conta do uso de suas imagens para treinamento do modelo.[9][10][11]
Ver também
Referências
- ↑ «Diffuse The Rest - a Hugging Face Space by huggingface». huggingface.co. Cópia arquivada em 5 de setembro de 2022
- ↑ Rombach; Blattmann; Lorenz; Esser; Ommer (Junho de 2022). High-Resolution Image Synthesis with Latent Diffusion Models (PDF). International Conference on Computer Vision and Pattern Recognition (CVPR). New Orleans, LA. pp. 10684–10695. arXiv:2112.10752
- ↑ «High-Resolution Image Synthesis with Latent Diffusion Models| Runway Research». Runway (em inglês)
- ↑ a b Cai, Kenrick. «Startup Behind AI Image Generator Stable Diffusion Is In Talks To Raise At A Valuation Up To $1 Billion». Forbes (em inglês). Consultado em 31 de outubro de 2022
- ↑ «Revolutionizing image generation by AI: Turning text into images». LMU Munich
- ↑ Stable Diffusion, CompVis - Machine Vision and Learning LMU Munich, 4 de novembro de 2022
- ↑ Heikkilä, Melissa (16 de setembro de 2022). «This artist is dominating AI-generated art. And he's not happy about it.». MIT Technology Review
- ↑ James Vincent "AI art tools Stable Diffusion and Midjourney targeted with copyright lawsuit" The Verge, 16 January, 2023.
- ↑ Korn, Jennifer (17 de janeiro de 2023). «Getty Images suing the makers of popular AI art tool for allegedly stealing photos». CNN (em inglês). Consultado em 22 de janeiro de 2023
- ↑ Vincent, James (15 de setembro de 2022). «Anyone can use this AI art generator — that's the risk». The Verge (em inglês). Consultado em 27 de março de 2023
- ↑ «This AI Tool Is Being Used to Make Freaky, Machine-Generated Porn». www.vice.com (em inglês). 24 de agosto de 2023. Consultado em 27 de março de 2023