[D] Are there emergent abilities of image models?

Just finished reading the Stanford/Google survey paper (https://arxiv.org/abs/2206.07682) on emergent abilities of large language models. It made me wonder: do image generation models have emergent abilities, too? Do we know?

I can't quite wrap my head around what such an ability would even look like. Figured maybe other folks had given this a think.