AI 現場轉播的魅力
最近,AI 現場轉播影片在社交媒體上迅速走紅,無論是 NBA 的比賽、KBO 的職棒賽、F1 的賽車,甚至 K-pop 的演唱會,這些影片都吸引了大量觀眾。作為一名自動化與 AI 系統架構師,我深刻體會到這種內容的魅力,它不僅能夠吸引觀眾,還能提供一種全新的觀看體驗。尤其是這些影片的質感,讓人幾乎無法辨識出是 AI 創作的,這無疑是技術進步的一個重要標誌。
為何選擇全自動化
當我開始嘗試製作這類影片時,發現手動製作的過程繁瑣且耗時。需要自己撰寫提示詞、調整鏡頭、控制角色動作,甚至不斷測試 AI 模型的穩定性。這些繁瑣的工作讓我決定將整個流程自動化,使用 n8n 工作流來簡化這一切。
AI 現場轉播的特點
AI 現場轉播的特點在於它能夠模擬真實的觀眾反應,角色的動作自然流暢,像是揮手、比愛心等微小動作,這些都是吸引觀眾的重要因素。隨著技術的進步,這些細節的表現越來越真實,讓觀眾感受到身臨其境的感覺。
自動化工作流的設計
在設計這個工作流時,我的目標是簡化操作,讓使用者只需提供一張角色參考圖和選擇運動類型,然後由系統自動生成相應的提示詞。這樣的設計不僅提升了效率,也降低了使用門檻。透過 n8n,我能夠將不同的 AI 模型串聯起來,實現全自動的工作流。
角色參考圖的使用
使用者只需上傳一張角色參考圖,系統就會根據選擇的運動類型自動生成相應的提示詞。這樣的設計不僅方便使用,還能確保生成的內容具有一致性,讓觀眾感受到更真實的現場氛圍。
生成提示詞的智能化
在這個工作流中,我讓 GPT 自動生成最適合的現場轉播提示詞。這樣一來,不同運動的觀眾氛圍、燈光、轉播 UI 等都能夠得到精準的反映,進一步提升影片的真實感。
生成與審核流程
在圖片生成後,我設計了人工審核的步驟,這是為了確保生成的內容質量。雖然 AI 的效果已經相當不錯,但有時候仍會出現一些不自然的情況,比如手部動作怪異或構圖不佳。因此,我在 Notion 中設計了一個審核界面,讓使用者可以方便地檢查生成的內容。
人工審核的重要性
人工審核的步驟對於提高影片的質量至關重要。雖然 AI 模型的表現越來越穩定,但偶爾仍會出現一些問題,例如人物的構圖不自然或動作不協調。這時候,人工審核就能夠幫助我把關,確保生成的內容符合預期。
影片生成的自動化
在審核通過後,工作流會自動將生成的圖片轉換成影片,這一過程中我特別控制了角色的動作,讓它們不會突然變得不自然。這樣的設計使得生成的影片更符合觀眾的期待,提升了觀看體驗。
成本與模型選擇
在這套工作流中,我使用了多種 AI 模型,這些模型的選擇對於生成質量和成本都有直接影響。對於圖片生成,我選擇了 GPT Image 2,因為它在穩定性和質感上都有著優異的表現。而在影片生成方面,我則使用了 Wan 2.7 Image To Video,這兩者的搭配讓整個工作流的效果達到了最佳。
圖片生成的成本
使用 GPT Image 2 生成 4K 圖片的成本大約是每張 16 credits,換算下來約為 0.08 美金。這樣的成本在目前的市場上算是相當合理,尤其是考慮到生成的質量和效果。
影片生成的經濟性
在影片生成方面,Wan 2.7 的價格也相當親民,720P 每秒 16 credits,1080P 每秒 24 credits。由於 Shorts 類型的影片通常只需要 5 秒,因此整體成本相對較低,讓我可以在不超過預算的情況下,實現高品質的內容創作。
