TL;DR
NotebookLM 生成的簡報預設為靜態 PDF,無法修改圖文排版。本文介紹一種結合 Google Gemini Canvas 與開源工具 NBLM2PPTX 的解決方案,透過一段程式碼即可在瀏覽器中執行「PDF 轉 PPTX」的本地應用。此方法能自動分離圖片背景與文字(OCR),重組為可編輯圖層,大幅縮短重製簡報的時間,適合追求效率的知識工作者。
NotebookLM 簡報功能的「最後一哩路」
Google NotebookLM 雖然能快速將文獻轉化為簡報大綱與視覺草稿,但其輸出的 PDF 檔案本質上是「平面化」的圖片與文字,使用者無法調整標題位置、更換配圖或修改內文。對於需要進行二次編輯的專業簡報場景,這是一大痛點。
傳統的 PDF 轉 PPT 工具往往只能將整頁 PDF 轉為一張背景圖,或者文字辨識率極低。而透過 AI 輔助的「重組式轉換」,則能將靜態頁面拆解為「背景層」與「文字層」,還原簡報的編輯彈性。
核心解法:Gemini Canvas + 開源程式碼
本教學使用開源專案 NBLM2PPTX(基於 GitHub 開源代碼),配合 Gemini 的 Canvas(畫布)功能,建立一個臨時的網頁應用程式。
運作原理
該工具並非單純的格式轉檔,而是執行了以下三個自動化步驟:
- 去背與分離:利用 AI 模型將 PDF 頁面中的圖片背景提取出來。
- 光學字元辨識(OCR):讀取畫面上的文字內容,並轉換為可編輯的文字方塊。
- 圖層重組:將乾淨的背景圖與識別出的文字方塊重新合併,生成標準的
.pptx檔案。
實作教學:5 步驟完成轉換
此方法完全免費,且檔案處理主要在瀏覽器端完成,操作流程如下:
步驟 1:啟動 Gemini Canvas 環境
進入 Google Gemini 介面,輸入以下指令以喚醒 Canvas 的程式撰寫模式:
「產生最小可執行的網頁程式」
Gemini 會開啟右側的 Canvas 視窗並生成一段基礎代碼,此時我們不需要執行這段代碼,只需確認 Canvas 環境已啟動。
步驟 2:獲取開源程式碼
前往 GitHub 搜尋 NBLM2PPTX 專案(或直接尋找相關開源庫的 index.html)。
- 找到對應語言版本(如繁體中文版
index.html)。 - 複製該檔案內的完整程式碼。
步驟 3:植入與執行
回到 Gemini Canvas 視窗:
- 切換至「程式碼(Code)」檢視模式。
- 全選並刪除 Gemini 原本生成的代碼。
- 貼上 剛才複製的 NBLM2PPTX 程式碼。
- 點擊右下角的「預覽(Preview)」或執行按鈕。
步驟 4:上傳與轉換
此時 Canvas 視窗會變成一個操作介面:
- 將 NotebookLM 產生的 PDF 簡報拖曳至上傳區。
- 系統會預覽所有頁面,預設全選。
- 點擊「開始處理」。
步驟 5:下載與微調
程式會逐頁進行影像分離與文字辨識(視頁數多寡需等待數秒至數分鐘)。完成後點擊「合併 PPT 檔案」即可下載。
打開下載的 PPTX 檔,你會發現原本死板的 PDF 已變成多個圖層:
- 文字:已轉為獨立文字方塊,可直接修改內容或字體。
- 圖片:背景圖層已獨立,不再干擾文字編輯。
限制與優化建議
雖然此方法比重做簡報快上許多,但受限於 OCR 技術與 PDF 解析度,仍有以下限制:
| 檢核項目 | 現況描述 | 建議解法 |
|---|---|---|
| 文字辨識率 | 約 85%-95%,部分特殊字體或淺色字可能漏失 | 轉換後務必人工校對,補上遺漏文字 |
| 圖片品質 | 取決於原 PDF 解析度,可能有輕微模糊 | 若需高畫質,建議手動替換關鍵圖片 |
| 排版精準度 | 文字方塊位置可能微幅位移 | 善用 PPT 的「對齊」工具快速修正 |
結論
透過 Gemini Canvas 執行開源腳本,我們能打破 NotebookLM 的封閉格式限制。這不僅是一個轉檔技巧,更示範了如何利用 LLM 的程式執行能力,將 GitHub 上的開源資源轉化為隨手可用的生產力工具。對於習慣使用 AI 輔助發想的簡報者來說,這是銜接「AI 生成」與「人工完稿」的關鍵橋樑。
權威引用來源
- GitHub: NBLM2PPTX Repository (Open Source Implementation)
- Google: Gemini Advanced & Canvas Documentation
- NotebookLM: Official User Guide
作者資訊
Skye
專注於 AI 工作流優化與數位轉型策略。致力於挖掘將前沿 AI 技術轉化為具體生產力的方法,擅長拆解複雜技術並重組為易於執行的 SOP。
作者觀點
AI 工具的價值往往不在於單一強大的模型,而在於如何將不同工具串聯起來。本文展示的「NotebookLM + Gemini Canvas」組合,正是未來「模組化 AI 工作流」的縮影——使用者不再等待單一軟體更新功能,而是自己動手組合出解決方案。
