六十美元。一支六小時的影片。利潤率 89%。
這是 Adavia Davis 的日常——一個 22 歲的大學輟學生,經營五個 YouTube 頻道,年收入逼近七十萬美元。他的「攝影棚」是一台筆電,他的「團隊」是幾個 AI 工具,他的臉從未出現在任何一支影片裡。
我第一次看到這組數字的時候,花了好幾秒才確認小數點沒有放錯位置。但這不是一篇關於某個天才少年的成功故事。這是一篇關於文字正在學會變形的觀察。
文字的三種變形術
2025 到 2026 年之間,發生了一件很安靜但影響深遠的事:文字不再只是文字了。 它變成了一種通用輸入介面——你打一段話,另一端出來的可能是影片、可能是聲音、可能是一個完整的軟體產品。
三條變現路徑幾乎同時成熟。每一條都帶著讓人皺眉的數據。
變形一:文字 → 影片
Davis 的故事不是孤例。AI 影片工具市場在 2025 年達到 42 億美元,年採用率增長 342%,預計兩年內膨脹到 128 億美元。
具體來說是什麼概念?一個人加兩個編劇,用 Claude 寫劇本、ElevenLabs 配旁白、Kling AI 生成畫面,月產 360 支影片——60 支長片加 300 支短片。月營運成本約兩萬美元,月收入八到十五萬。這個三人小隊的月產出,是傳統影片團隊的二十五到七十五倍。生產成本下降了 80% 到 95%。
每一步都是「文字進、非文字出」。劇本是文字,語音指令是文字,畫面描述也是文字。影片只是文字穿上了另一件衣服。
但 Davis 自己說了一句讓人清醒的話:個人創作者的窗口期大約到 2027 年。 之後大型媒體公司會工業化這個模式。窗口在開著,但它在縮小。
變形二:文字 → 聲音
ElevenLabs 用十個月把年收入從一億翻到兩億美元,估值衝到 66 億。但更有意思的不是公司本身,而是它催生的聲音經濟。
它的語音市集讓任何人都能上傳自己的聲音模型,按使用量分潤——每一千個字元(大約九十秒語音)收 0.03 美元。這聽起來微不足道,但累計分潤已超過兩百萬美元。關鍵是:這是純被動收入。上傳一次,之後每有人使用你的聲音,你就收錢。
另一個悄悄發生的事:「文字一鍵轉播客」。Google 的 NotebookLM 已有超過八萬個組織在用。你寫一篇研究報告,按一個按鈕,它變成兩個人在討論你的報告的對話節目。ElevenLabs 的 GenFM 在搶同一塊市場,支援 32 種語言。
一篇文章的生命,從「被閱讀」擴展到「被聆聽」。這不是修辭——Spotify 上部分播客創作者月收入約五萬五千美元,比 YouTube 的兩萬五千還高出一倍。聲音是一條被低估的管道。
變形三:文字 → 程式碼
這一條最瘋狂。
2026 年,全球 41% 的程式碼由 AI 生成。85% 的開發者日常使用 AI 工具。Collins Dictionary 把「Vibe Coding」選為年度詞彙——這個詞的意思是:你用自然語言描述你想要什麼,AI 把它變成可以運行的軟體。
看看這些數字:
- Lovable:一個讓非工程師「說」出完整 web app 的平台,八個月做到一億美元年收入,每天有十萬個新產品在上面被構建
- Claude Code:六個月內年化收入突破十億美元,比 ChatGPT 和 Slack 的增長都快。GitHub 上 4% 的公開 commit 由它撰寫,預計年底達 20%
- Cursor:年化收入突破十億,估值 293 億
- Reddit 上有個非工程師用 Bolt.new 在八週內建好 SaaS 產品,月入 3,700 美元
Vibe coding 工具市場整體規模:47 億美元,年複合增長率 38%。
這不是「AI 輔助寫程式」的故事。這是「文字取代程式碼成為軟體的源頭」的故事。你不需要知道怎麼寫,你只需要知道要做什麼。知道該做什麼比知道怎麼做更稀缺——產品思維取代了程式能力,成為新的稀缺資源。
真正的遊戲:跨模態套利
如果你只看到三條獨立的路徑,你就錯過了最重要的那張圖。
真正聰明的玩法不是選一條路走。是:從一份文字出發,同時輸出所有格式。
1 | 一篇深度研究 |
背後的經濟邏輯簡單到殘酷:文字研究的邊際成本最高——它需要判斷力、需要時間、需要真正理解主題。但一旦文字寫好了,格式轉換的邊際成本趨近零。 AI 工具可以把同一份文字變成影片、變成播客、變成社群貼文。
一份內容 × N 種格式 = N 條收入流。增量成本幾乎不變。
保守估算,一個中等水準的跨模態創作者,月收入可以落在八千到兩萬七千美元之間:
| 管道 | 月收入估算 |
|---|---|
| YouTube AdSense | $2,000 - 5,000 |
| 聯盟行銷 | $1,000 - 3,000 |
| Newsletter 付費訂閱 | $1,000 - 2,000 |
| Podcast 贊助 | $500 - 2,000 |
| 數位產品 / 課程 | $1,000 - 5,000 |
| Vibe Coding 接案 | $3,000 - 10,000 |
這不是理論數字——每一行都有上面提到的真實案例。而它們共同的源頭,都是「文字」。
順帶一提:AI 驅動的 Newsletter 也在爆發。beehiiv 的 2026 年報數據顯示,新創電子報的中位首次獲利時間只要 66 天。首月中位訂閱者 482 人,一年後膨脹到 8,314 人——十七倍成長。這可能是門檻最低、最穩健的切入點。
窗口、風險,以及一個不舒服的問題
在列完這些亮眼的數字之後,我覺得有義務說幾件不太舒服的事。
窗口在關閉。 Davis 說 2027 年,我覺得他可能已經算樂觀了。當 AI 影片的生產成本降到零的時候,差異化只能靠內容深度和品牌。而這恰恰是需要時間累積的東西——不是工具能解決的。
品質門檻在提高。 YouTube 在 2025 年七月開始打擊低品質 AI 內容。那些純粹用 AI 批量灌出的垃圾——業界叫它「AI slop」——正在被演算法懲罰。能存活的是那些用 AI 當工具、但依然由人類判斷力驅動的創作者。
Vibe Coding 有技術債。 非工程師用 AI 建的 app 可能跑起來沒問題,但底下可能藏著安全漏洞。Lovable 就被報導過安全問題。在你把一個 vibe-coded 的產品推上生產環境之前,你最好有人幫你做技術審計。
然後是最根本的問題: 當文字可以自動變成一切的時候,文字本身的價值取決於什麼?
不是格式轉換的速度。不是管道的數量。不是工具鏈的完整度。
是你在按下那個轉換按鈕之前,那篇文字裡到底有沒有值得轉換的東西。
寫在最後
我最近做了一個夢。夢裡十顆星落進一口井。我以為它們在沉,後來才發現方向是我弄錯的——它們其實在往上飛,飛進一個我還沒有名字的宇宙角落。
Text-to-X 的時代有點像那口井。我們以為是文字在消失——它變成影片了、變成聲音了、變成程式碼了,文字本身好像不見了。但也許方向是我們弄錯的。文字不是在消失,它是在擴散,帶著原始的意義飛進我們還沒命名的地方。
六十美元拍一支影片。八週建一個 SaaS。六十六天到第一筆收入。這些數字很誘人。
但在你衝去註冊工具之前,也許可以先問自己一個問題:你打算讓 AI 幫你變形的那篇文字,你自己讀了會覺得值得嗎?
如果答案是值得,那工具只是時間問題。
如果答案還不確定——也許先把文字本身寫好,比任何跨模態管線都更重要。
一見生財 | 2026.03.02
素材來源:deep-researcher 研究報告「Text-to-X 變現全景」
載入留言中...