樂譜 OMR 是什麼?光學樂譜辨識入門
樂譜 OMR 是什麼?了解 Optical Music Recognition 如何把 PDF、掃描或照片中的樂譜轉成 MIDI、MusicXML 等可編輯資料。
樂譜 OMR 是什麼?簡單說,OMR 在音樂語境裡通常指 Optical Music Recognition,也就是光學樂譜辨識:把印刷樂譜、掃描 PDF 或照片中的音符與節奏,轉成電腦可以播放、移調或編輯的音樂資料。
這裡要先釐清一點:在一般搜尋結果裡,OMR 也可能指考卷劃記辨識、工業製程或貨幣代碼。但音樂人談的 OMR,核心問題是「怎麼讓電腦讀懂樂譜」。它要把靜態紙面變成 MIDI、MusicXML 或其他可處理格式,讓你可以在 DAW、打譜軟體或練習流程中繼續使用。
過去遇到紙本樂譜,常見做法是手動輸入每顆音、每個休止符和每個節奏。這很耗時,也會消磨創作耐心。OMR 的價值,就是把「從紙到數位」這段機械性工作縮短,讓你把時間留給校對、詮釋和音樂判斷。
定義 OMR:紙本樂譜和數位資料之間的橋
在最基本的層次,Optical Music Recognition 是讓電腦從實體文件或靜態圖片中讀取音樂記譜,並轉換成機器可讀格式的技術。你可以把它想成音樂版 OCR。
OCR 讀的是文字:收據、文件、菜單或書頁。OMR 讀的是樂譜:五線、譜號、音符頭、符桿、符尾、休止符、調號、拍號和各種記號。
但樂譜比文字更複雜。文字多半沿著一行往右讀;音樂是二維語言。音符的意義不只取決於形狀,還取決於它在五線上的高度、當前譜號、調號、小節位置和節奏關係。OMR 不只是辨識符號,還要理解符號之間的音樂邏輯。
OMR 的目標,是把靜態影像轉成 MusicXML 或 MIDI 等格式。完成後,你可以播放、移調、匯入 DAW,或在 MuseScore、Finale、Sibelius、Dorico 等打譜軟體中繼續編輯。
| 名詞 | 讀取內容 | 轉換後能編輯什麼 |
|---|---|---|
| OCR | 印刷或手寫文字 | 文字、段落、文件版面 |
| OMR | 樂譜、譜號、音符、休止符和節奏 | 音高、節奏、移調、播放、MIDI 或 MusicXML |
| 手動輸入 | 你逐顆輸入的音符 | 幾乎全部可控,但需要大量時間 |
OMR 怎麼工作:四個辨識階段

要理解 OMR 如何幫助音樂工作流,可以先看它背後通常經過的四個階段。
1. 影像預處理:整理畫布
你上傳的樂譜照片或掃描檔不一定完美。頁面可能歪斜、光線不均、墨色淡,或有陰影。預處理階段會提高對比、校正傾斜、清理背景,並找出五線位置。有些系統還會暫時移除水平五線,讓音符、休止符和其他符號更容易被分離。
2. 符號辨識:看見音樂物件
畫面清理後,AI 會掃描文件並分類物件。它要辨識高音譜號、低音譜號、四分音符、二分音符、休止符、升降記號,甚至藏在和弦旁邊的小記號。
3. 音樂重建:套用樂理邏輯
真正困難的部分在這裡。系統必須根據音符頭和五線的相對位置計算音高,根據符桿、符尾、連音線和小節結構推算節奏,並確認每小節的總時值和拍號相符。這像是在解一個帶有音樂規則的視覺拼圖。
如果你還在學這些譜面元素怎麼互相作用,可以先看 鋼琴譜怎麼看,會用初學者角度拆解大譜表、節奏和中央 C。
4. 語意編碼:輸出成可用格式
最後,OMR 會把辨識出的音樂邏輯包裝成標準格式。MusicXML 更適合保留譜面結構和打譜資訊;MIDI 更適合播放、DAW 編輯和音色製作。要選哪一種,取決於你下一步想改樂譜,還是改聲音。
音樂人為什麼需要 OMR
技術本身有趣,但真正重要的是它能減少哪些日常摩擦。
- 快速移調:歌手或伴奏者拿到不合音域的譜,可以先轉成可編輯資料,再在打譜軟體中移調。
- 預聽陌生樂譜:排練前拿到複雜總譜時,可以先轉成可播放資料,了解和聲走向和節奏密度。
- 典藏與保存:合唱團、樂團或教師手上常有老舊紙譜。OMR 能把易損文件轉成更容易保存和編輯的數位檔。
- 編曲與取樣準備:製作人可以把公共領域鋼琴譜或樂曲轉成 MIDI,再指定虛擬樂器、重配和聲或進一步編曲。
如果你的工作流是把鋼琴譜轉成 DAW 可用資料,可以接著看 鋼琴譜轉 MIDI。
限制:AI 仍然需要人類校對

OMR 很有用,但它不是魔法。音樂工作中最需要誠實看待的是它的邊界。
最明顯的限制是 手寫譜。標準印刷樂譜相對規則,但人的手寫有很大差異。匆忙寫下的八分音符、連線、休止符或力度記號,可能看起來像墨水雜訊。
另一個難點是極度密集的複音。當多個獨立聲部、圓滑線、力度記號和踏板線在同一區域重疊時,系統可能很難判斷哪些符號屬於同一個聲部,或某個音應該持續多久。
因此,專業 OMR 工作流通常是「AI 輔助」而不是「全自動」。工具負責大部分機械性輸入,為你省下大量時間;音樂人則負責最後校對,修正剩下的音高、節奏、聲部和詮釋問題。
走進現代樂譜數位化流程

音樂人的終極目標,不是把時間花在資料輸入,而是花在演奏、編曲、教學和創作。OMR 的意義,就是把紙本和數位環境之間的阻力降到更低。
如果你桌上有一疊樂譜,或電腦裡有待處理的 PDF,可以用瀏覽器工作流做第一輪測試。Melogen Sheet2MIDI 可用於將乾淨 PDF、掃描或圖片樂譜轉成 MIDI,方便你播放、檢查並進一步整理。若目標是打譜軟體中的排版和記譜編輯,則可以考慮 PDF to MusicXML。
用真實樂譜測試 OMR
上傳乾淨 PDF、掃描或照片到 Melogen Sheet2MIDI,先檢查辨識出的音符,再把 MIDI 帶進 DAW 或練習流程。
常見問題
OMR 和 OCR 有什麼不同?
OCR 讀文字,OMR 讀音樂記譜。OMR 不只要認出符號,還要理解音高、節奏、譜號、調號和小節結構之間的關係。
OMR 可以處理手寫譜嗎?
有些 AI 工具能處理部分手寫譜,但準確度通常比印刷譜低很多。手寫來源建議先當成草稿轉換,再保留較多人工校對時間。
OMR 輸出 MIDI 還是 MusicXML 比較好?
想進 DAW、做播放、編曲或音色處理,通常選 MIDI。想在打譜軟體中修譜、移調、重新排版,通常選 MusicXML。兩者用途不同,沒有絕對誰比較好。
總結

樂譜 OMR 是把紙本樂譜和數位音樂環境連起來的技術。它透過影像預處理、符號辨識、音樂邏輯重建和格式編碼,把 PDF、掃描或照片中的樂譜轉成 MIDI、MusicXML 等可使用資料。
對現代音樂人來說,這代表你可以更快移調、預聽、典藏、編曲和校對,而不必把時間全花在手動輸入。它仍然需要人類耳朵和樂理判斷,尤其是面對手寫譜、密集複音和複雜符號時;但只要把 OMR 當成第一輪助手,它就能大幅縮短從紙面到創作環境的距離。
作者介紹
