我把 2000 多条 Seedance 2 提示词整理成了网站和开源数据集，随便你用

自己做 AI 视频的时候，找 Seedance 2 的提示词太费劲了。

X、抖音、Discord 到处翻，找到的很多都是截图，没法复制。网上所谓的“提示词合集”，要么收费，要么只有干巴巴的文字，没有原视频、没有分类、没有结构，想深入研究根本用不了。

就想着自己整理一份吧。结果越整理越多，最后索性做成了一个网站 + 一个开源数据集。

网址是 prompthub.gokuscraper.com，打开就能用，不用注册，不用登录。

目前支持的模型有 Seedance 2、Midjourney V6、Flux、GPT Image 2、Nano Banana Pro 等，基本覆盖了主流的 AI 图像和视频生成工具。

提示词按用途分了几个类：热门推荐、今日更新、娱乐整活、商业生产力、自媒体创作，还有按来源分的“来自 X（Twitter）”和“来自抖音”，方便不同需求的人快速筛选。

每条提示词都有视频预览，不是纯文字列表，效果一目了然。支持按标题、标签、内容搜索，想找特定风格直接搜就行。点一下“复制”按钮，整段提示词直接拿走，不用手动划拉。

还有个“一键生图”⚡ 按钮，点了就能跳转去对应平台生成。翻到底部自动加载更多，像刷信息流一样，不知不觉就攒了一堆灵感。

但网站只是个壳，真正花心思的是背后的数据集。

如果只是搭个网站展示提示词，其实不用费这么大劲。但我从一开始就想着，这些数据不能只放在网页上看，得做成真正的开放数据。

数据集叫 seedance-2-prompts-datasets，放在 Hugging Face 上，总量 12GB，包含 2110+ 条 Seedance 2.0 生成的视频（mp4）和封面图（jpg）。

核心是一个 metadata.jsonl 文件，每条提示词都做了结构化处理。标题、标签、中英文翻译、视频文件对应关系、分辨率、时长、安全评级，全部标好规整了。举个数据条目的例子：

json

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
{
  "id": "SD2_00133",
  "category": "Entertainment",
  "raw_p": "Environment: A colossal glacial canyon under pale blue twilight...",
  "media": {
    "v": "seedance-2/videos/SD2_00133.mp4",
    "c": "seedance-2/covers/SD2_00133.jpg"
  },
  "spec": { "width": 1280, "height": 720, "ratio": 1.78, "duration": 15.12 },
  "i18n": {
    "zh": { "t": "冰谷虎蛇战", "p": "环境：一座巨大的冰川峡谷...", "tags": ["冰川峡谷", "冰虎", "霜蛇"] },
    "en": { "t": "Glacial Tiger vs Frost Serpent", "p": "Environment: A colossal...", "tags": ["ice canyon", "cinematic"] }
  }
}

对于开发者来说，一行代码就能加载整个数据集：

python

1
2
import pandas as pd
df = pd.read_json("https://huggingface.co/datasets/GokuScraper/seedance-2-prompts-datasets/raw/main/metadata.jsonl", lines=True)

适合做研究、工具开发、模型训练等二次使用。整个数据集采用 CC BY 4.0 协议，商用也没问题，只需署名。

为什么非要费劲做成结构化数据？

AI 时代，提示词本质上是一种新的“生产力语言”。但现状是：好提示词散落在各个角落，截图、推文、视频评论区，零零碎碎，能找到但没法用。

我想做的事很简单：把散落的好提示词收集起来，做成机器能读、人能检索、开发者能直接用的数据。不只是“展示”，而是真正可计算、可二次开发的数据资产。

这个项目和网站只是第一步。

当然，现在远谈不上完善。

说实话，做完是一回事，做好是另一回事。这个项目和网站还有很多我自己都不太满意的地方，坦率列出来：