August 24th, 2023 - Revolutionizing Pixels and Prose: Breakthroughs in Diffusion Models, Multimodal Language Learning, and Media Editing
MP3•Episod hem
Manage episode 375164891 series 3485608
Innehåll tillhandahållet av Marcus Edel. Allt poddinnehåll inklusive avsnitt, grafik och podcastbeskrivningar laddas upp och tillhandahålls direkt av Marcus Edel eller deras podcastplattformspartner. Om du tror att någon använder ditt upphovsrättsskyddade verk utan din tillåtelse kan du följa processen som beskrivs här https://sv.player.fm/legal.
…
continue reading
Kapitel
1. Intro (00:00:00)
2. Scalable Diffusion Models with Transformers (00:01:18)
3. BLIVA: A Simple Multimodal LLM for Better Handling of Text-Rich Visual Questions (00:03:02)
4. StableVideo: Text-driven Consistency-aware Diffusion Video Editing (00:04:10)
5. Exploiting Diffusion Prior for Real-World Image Super-Resolution (00:06:36)
75 episoder