返回部落格

樂譜 OMR 是什麼?光學樂譜辨識入門

樂譜 OMR 是什麼?了解 Optical Music Recognition 如何把 PDF、掃描或照片中的樂譜轉成 MIDI、MusicXML 等可編輯資料。

發布: April 1, 2026約 11 分鐘閱讀
Zhang Guo
Zhang Guo
作曲者 · AI 產品經理
分享

把這篇文章發給需要改善音樂工作流程的人。

XFacebookLinkedInInstagram

Instagram 暫不支援網頁直發分享,可複製連結後貼到限時動態或私訊。

樂譜 OMR 是什麼?簡單說,OMR 在音樂語境裡通常指 Optical Music Recognition,也就是光學樂譜辨識:把印刷樂譜、掃描 PDF 或照片中的音符與節奏,轉成電腦可以播放、移調或編輯的音樂資料。

這裡要先釐清一點:在一般搜尋結果裡,OMR 也可能指考卷劃記辨識、工業製程或貨幣代碼。但音樂人談的 OMR,核心問題是「怎麼讓電腦讀懂樂譜」。它要把靜態紙面變成 MIDI、MusicXML 或其他可處理格式,讓你可以在 DAW、打譜軟體或練習流程中繼續使用。

過去遇到紙本樂譜,常見做法是手動輸入每顆音、每個休止符和每個節奏。這很耗時,也會消磨創作耐心。OMR 的價值,就是把「從紙到數位」這段機械性工作縮短,讓你把時間留給校對、詮釋和音樂判斷。

定義 OMR:紙本樂譜和數位資料之間的橋

在最基本的層次,Optical Music Recognition 是讓電腦從實體文件或靜態圖片中讀取音樂記譜,並轉換成機器可讀格式的技術。你可以把它想成音樂版 OCR。

OCR 讀的是文字:收據、文件、菜單或書頁。OMR 讀的是樂譜:五線、譜號、音符頭、符桿、符尾、休止符、調號、拍號和各種記號。

但樂譜比文字更複雜。文字多半沿著一行往右讀;音樂是二維語言。音符的意義不只取決於形狀,還取決於它在五線上的高度、當前譜號、調號、小節位置和節奏關係。OMR 不只是辨識符號,還要理解符號之間的音樂邏輯。

OMR 的目標,是把靜態影像轉成 MusicXMLMIDI 等格式。完成後,你可以播放、移調、匯入 DAW,或在 MuseScore、Finale、Sibelius、Dorico 等打譜軟體中繼續編輯。

名詞讀取內容轉換後能編輯什麼
OCR印刷或手寫文字文字、段落、文件版面
OMR樂譜、譜號、音符、休止符和節奏音高、節奏、移調、播放、MIDI 或 MusicXML
手動輸入你逐顆輸入的音符幾乎全部可控,但需要大量時間

OMR 怎麼工作:四個辨識階段

OMR 四階段流程圖,從影像預處理、符號辨識到音樂重建與格式編碼

要理解 OMR 如何幫助音樂工作流,可以先看它背後通常經過的四個階段。

1. 影像預處理:整理畫布

你上傳的樂譜照片或掃描檔不一定完美。頁面可能歪斜、光線不均、墨色淡,或有陰影。預處理階段會提高對比、校正傾斜、清理背景,並找出五線位置。有些系統還會暫時移除水平五線,讓音符、休止符和其他符號更容易被分離。

2. 符號辨識:看見音樂物件

畫面清理後,AI 會掃描文件並分類物件。它要辨識高音譜號、低音譜號、四分音符、二分音符、休止符、升降記號,甚至藏在和弦旁邊的小記號。

3. 音樂重建:套用樂理邏輯

真正困難的部分在這裡。系統必須根據音符頭和五線的相對位置計算音高,根據符桿、符尾、連音線和小節結構推算節奏,並確認每小節的總時值和拍號相符。這像是在解一個帶有音樂規則的視覺拼圖。

如果你還在學這些譜面元素怎麼互相作用,可以先看 鋼琴譜怎麼看,會用初學者角度拆解大譜表、節奏和中央 C。

4. 語意編碼:輸出成可用格式

最後,OMR 會把辨識出的音樂邏輯包裝成標準格式。MusicXML 更適合保留譜面結構和打譜資訊;MIDI 更適合播放、DAW 編輯和音色製作。要選哪一種,取決於你下一步想改樂譜,還是改聲音。

音樂人為什麼需要 OMR

技術本身有趣,但真正重要的是它能減少哪些日常摩擦。

  • 快速移調:歌手或伴奏者拿到不合音域的譜,可以先轉成可編輯資料,再在打譜軟體中移調。
  • 預聽陌生樂譜:排練前拿到複雜總譜時,可以先轉成可播放資料,了解和聲走向和節奏密度。
  • 典藏與保存:合唱團、樂團或教師手上常有老舊紙譜。OMR 能把易損文件轉成更容易保存和編輯的數位檔。
  • 編曲與取樣準備:製作人可以把公共領域鋼琴譜或樂曲轉成 MIDI,再指定虛擬樂器、重配和聲或進一步編曲。

如果你的工作流是把鋼琴譜轉成 DAW 可用資料,可以接著看 鋼琴譜轉 MIDI

限制:AI 仍然需要人類校對

OMR 限制示意,呈現手寫樂譜、密集複音與需要人工校對的區域

OMR 很有用,但它不是魔法。音樂工作中最需要誠實看待的是它的邊界。

最明顯的限制是 手寫譜。標準印刷樂譜相對規則,但人的手寫有很大差異。匆忙寫下的八分音符、連線、休止符或力度記號,可能看起來像墨水雜訊。

另一個難點是極度密集的複音。當多個獨立聲部、圓滑線、力度記號和踏板線在同一區域重疊時,系統可能很難判斷哪些符號屬於同一個聲部,或某個音應該持續多久。

因此,專業 OMR 工作流通常是「AI 輔助」而不是「全自動」。工具負責大部分機械性輸入,為你省下大量時間;音樂人則負責最後校對,修正剩下的音高、節奏、聲部和詮釋問題。

走進現代樂譜數位化流程

現代樂譜數位化流程示意,從紙本或 PDF 經 OMR 轉成 MIDI 與 MusicXML

音樂人的終極目標,不是把時間花在資料輸入,而是花在演奏、編曲、教學和創作。OMR 的意義,就是把紙本和數位環境之間的阻力降到更低。

如果你桌上有一疊樂譜,或電腦裡有待處理的 PDF,可以用瀏覽器工作流做第一輪測試。Melogen Sheet2MIDI 可用於將乾淨 PDF、掃描或圖片樂譜轉成 MIDI,方便你播放、檢查並進一步整理。若目標是打譜軟體中的排版和記譜編輯,則可以考慮 PDF to MusicXML

OMR 工作流

用真實樂譜測試 OMR

上傳乾淨 PDF、掃描或照片到 Melogen Sheet2MIDI,先檢查辨識出的音符,再把 MIDI 帶進 DAW 或練習流程。

常見問題

OMR 和 OCR 有什麼不同?

OCR 讀文字,OMR 讀音樂記譜。OMR 不只要認出符號,還要理解音高、節奏、譜號、調號和小節結構之間的關係。

OMR 可以處理手寫譜嗎?

有些 AI 工具能處理部分手寫譜,但準確度通常比印刷譜低很多。手寫來源建議先當成草稿轉換,再保留較多人工校對時間。

OMR 輸出 MIDI 還是 MusicXML 比較好?

想進 DAW、做播放、編曲或音色處理,通常選 MIDI。想在打譜軟體中修譜、移調、重新排版,通常選 MusicXML。兩者用途不同,沒有絕對誰比較好。

總結

OMR 總結示意,呈現 Optical Music Recognition 連接紙本樂譜與數位音樂環境

樂譜 OMR 是把紙本樂譜和數位音樂環境連起來的技術。它透過影像預處理、符號辨識、音樂邏輯重建和格式編碼,把 PDF、掃描或照片中的樂譜轉成 MIDI、MusicXML 等可使用資料。

對現代音樂人來說,這代表你可以更快移調、預聽、典藏、編曲和校對,而不必把時間全花在手動輸入。它仍然需要人類耳朵和樂理判斷,尤其是面對手寫譜、密集複音和複雜符號時;但只要把 OMR 當成第一輪助手,它就能大幅縮短從紙面到創作環境的距離。

作者介紹

Zhang Guo

Zhang Guo

作曲者 · AI 產品經理

AI 產品經理、數位行銷顧問,擁有音樂背景。我相信創造力是節奏與邏輯之間的橋樑:音樂直覺與數學精準,可以在真正有價值的產品決策中共存。

在 X 上關注
TuneFab 側邊欄廣告圖,推廣音樂轉換工具