TL;DR
NotebookLM 生成的簡報預設為靜態 PDF,無法修改圖文排版。本文介紹一種結合 Google Gemini Canvas 與開源工具 NBLM2PPTX 的解決方案,透過一段程式碼即可在瀏覽器中執行「PDF 轉 PPTX」的本地應用。此方法能自動分離圖片背景與文字(OCR),重組為可編輯圖層,大幅縮短重製簡報的時間,適合追求效率的知識工作者。


NotebookLM 簡報功能的「最後一哩路」

Google NotebookLM 雖然能快速將文獻轉化為簡報大綱與視覺草稿,但其輸出的 PDF 檔案本質上是「平面化」的圖片與文字,使用者無法調整標題位置、更換配圖或修改內文。對於需要進行二次編輯的專業簡報場景,這是一大痛點。

傳統的 PDF 轉 PPT 工具往往只能將整頁 PDF 轉為一張背景圖,或者文字辨識率極低。而透過 AI 輔助的「重組式轉換」,則能將靜態頁面拆解為「背景層」與「文字層」,還原簡報的編輯彈性。

核心解法:Gemini Canvas + 開源程式碼

本教學使用開源專案 NBLM2PPTX(基於 GitHub 開源代碼),配合 Gemini 的 Canvas(畫布)功能,建立一個臨時的網頁應用程式。

運作原理

該工具並非單純的格式轉檔,而是執行了以下三個自動化步驟:

  1. 去背與分離:利用 AI 模型將 PDF 頁面中的圖片背景提取出來。
  2. 光學字元辨識(OCR):讀取畫面上的文字內容,並轉換為可編輯的文字方塊。
  3. 圖層重組:將乾淨的背景圖與識別出的文字方塊重新合併,生成標準的 .pptx 檔案。

實作教學:5 步驟完成轉換

此方法完全免費,且檔案處理主要在瀏覽器端完成,操作流程如下:

步驟 1:啟動 Gemini Canvas 環境

進入 Google Gemini 介面,輸入以下指令以喚醒 Canvas 的程式撰寫模式:

「產生最小可執行的網頁程式」

Gemini 會開啟右側的 Canvas 視窗並生成一段基礎代碼,此時我們不需要執行這段代碼,只需確認 Canvas 環境已啟動。

步驟 2:獲取開源程式碼

前往 GitHub 搜尋 NBLM2PPTX 專案(或直接尋找相關開源庫的 index.html)。

  • 找到對應語言版本(如繁體中文版 index.html)。
  • 複製該檔案內的完整程式碼。

步驟 3:植入與執行

回到 Gemini Canvas 視窗:

  1. 切換至「程式碼(Code)」檢視模式。
  2. 全選並刪除 Gemini 原本生成的代碼。
  3. 貼上 剛才複製的 NBLM2PPTX 程式碼。
  4. 點擊右下角的「預覽(Preview)」或執行按鈕。

步驟 4:上傳與轉換

此時 Canvas 視窗會變成一個操作介面:

  1. 將 NotebookLM 產生的 PDF 簡報拖曳至上傳區。
  2. 系統會預覽所有頁面,預設全選。
  3. 點擊「開始處理」。

步驟 5:下載與微調

程式會逐頁進行影像分離與文字辨識(視頁數多寡需等待數秒至數分鐘)。完成後點擊「合併 PPT 檔案」即可下載。

打開下載的 PPTX 檔,你會發現原本死板的 PDF 已變成多個圖層:

  • 文字:已轉為獨立文字方塊,可直接修改內容或字體。
  • 圖片:背景圖層已獨立,不再干擾文字編輯。

限制與優化建議

雖然此方法比重做簡報快上許多,但受限於 OCR 技術與 PDF 解析度,仍有以下限制:

檢核項目 現況描述 建議解法
文字辨識率 約 85%-95%,部分特殊字體或淺色字可能漏失 轉換後務必人工校對,補上遺漏文字
圖片品質 取決於原 PDF 解析度,可能有輕微模糊 若需高畫質,建議手動替換關鍵圖片
排版精準度 文字方塊位置可能微幅位移 善用 PPT 的「對齊」工具快速修正

結論

透過 Gemini Canvas 執行開源腳本,我們能打破 NotebookLM 的封閉格式限制。這不僅是一個轉檔技巧,更示範了如何利用 LLM 的程式執行能力,將 GitHub 上的開源資源轉化為隨手可用的生產力工具。對於習慣使用 AI 輔助發想的簡報者來說,這是銜接「AI 生成」與「人工完稿」的關鍵橋樑。


權威引用來源

  • GitHub: NBLM2PPTX Repository (Open Source Implementation)
  • Google: Gemini Advanced & Canvas Documentation
  • NotebookLM: Official User Guide

作者資訊

Skye
專注於 AI 工作流優化與數位轉型策略。致力於挖掘將前沿 AI 技術轉化為具體生產力的方法,擅長拆解複雜技術並重組為易於執行的 SOP。

作者觀點
AI 工具的價值往往不在於單一強大的模型,而在於如何將不同工具串聯起來。本文展示的「NotebookLM + Gemini Canvas」組合,正是未來「模組化 AI 工作流」的縮影——使用者不再等待單一軟體更新功能,而是自己動手組合出解決方案。

Share this post
Skye

Hey, I'm Skye, and I believe every creator deserves the tools to turn their imagination into reality.

Loading...