神经笔记乃音频插件,能引音至MIDI之转换,当今之至精也入汝所好之數位音樂工作站。
- 可与任何宫商角徵羽之器相协,声亦在其内。
- 支持多音节转录
- 善辨音调之变
- 轻便迅捷之速录也
- 听录时可调参数
- 可直接于插件内缩放并时量化转录之MIDI
安装神经笔记
下载适用于您平台之最新版本于此(Windows、macOS(通用)及Linux皆支持)!
Windows與Mac皆備安裝程序,有獨立版、VST3版及AU(限Mac)版本。此程序允許用戶自選欲安裝之格式。macOS上,程式已簽名,而Windows則否。此即Windows上使用NeuralNote或需多行細步之意。
Linux之用,VST3與獨立應用程式,皆供原生二進制檔。可將檔案複製至適當位置而安裝之。
用法
NeuralNote乃簡易音效插件(VST3/AU/獨立應用程式),用以應用於軌道以進行音訊轉寫。
其流程至簡:
- 蒐集若干音訊
- 击录之。实录或DAW中播放轨道,皆可为之。
- 亦可将音频文件投诸插件。(.wav, .aiff, .flac, .mp3及.ogg(vorbis)皆可受用)。
- MIDI之转录,立现于钢琴卷帘之中。
- 击播放之钮,以闻其果。
- 调其不同之设,以整转录,即便闻之。
- 各自调适本音之音量,及合成之文字转录之音量
- 既满意,自插件拖曳至MIDI轨道,导出MIDI转录之文
观吾等所呈之神经音频插件竞赛之视频于此.
神经音符内用Spotify之模型基本音高。欲知详,可阅其博文与论文。于NeuralNote中,基本音高以RTNeural行CNN之务,以ONNXRuntime行特征之务(常数Q变换计算+和声堆叠)。此项目之部分也。吾等有所助于RTNeural增二维卷积之支。
自源构建
需求者:git,cmake,及尔之操作系统所偏之编译套件。
此乃克隆之时所用也
git clone --recurse-submodules --shallow-submodules https://github.com/DamRsn/NeuralNote
此操作系统特异构建脚本,须至少执行一次,方可用此项目为常规CMake项目。脚本下载onnxruntime静态库(吾等以ort-builder所创),而后调用CMake。
macOS
$ ./build.sh
Windows
缘于已知之问题,若汝未用 Visual Studio 2022 (MSVC 版本:19.35.x,则须检视 cl 之输出),则当自行构建 onnxruntime.lib,如
-
。务须备 Python;若未,则下载数据于 https://www.python.org/downloads/windows/ (此当前不与 Python 3.11 相容,宜用 Python 3.10)。
-
,于命令行逐行执行下列诸句:
git clone --depth 1 --recurse-submodules --shallow-submodules https://github.com/tiborvass/libonnxruntime-neuralnote ThirdParty\onnxruntime
cd ThirdParty\onnxruntime
python3 -m venv venv
.\venv\Scripts\activate.bat
pip install -r requirements.txt
.\convert-model-to-ort.bat model.onnx
.\build-win.bat model.required_operators_and_types.with_runtime_opt.config
copy model.with_runtime_opt.ort ..\..\Lib\ModelData\features_model.ort
cd ..\..
尔今可复筑神经笔记,其法若此:
> .\build.bat
集成开发环境
既行构建脚本至少一次,尔可载此项目于所好之集成开发环境(CLion/Visual Studio/VSCode等)中,击‘构建’以成其一目标。
复用神经笔记之转录引擎之码
凡转录所行之码,尽在Lib/Model與諸模倫之重皆在Lib/ModelData/。可自用此段碼於己之項目!後當試將其與倉庫餘部隔絕,為一獨立之庫。
生成Lib/ModelData/中諸檔之碼,今未公開,因其需繁複手作業。然此為吾輩創造此檔所循之序,略述如下:
features_model.onnx乃由tf2onnx生成,此法将 keras 模型之 CQT 与和声堆叠部分,取其全基本音图之精髓,并辅以手动添加之权重以调校批量归一化。- 所得
.json文件,载基本音 CNN 之权重,乃由 basic-pitch-ts 仓库中 tensorflow-js 模型所衍。 既化,复以tf2onnx转为 onnx。终,手动聚其重,以.npy之效,赖 Netron,而后施于一分 keras 之模,以 basic-pitch 之码所创。
原之 basic-pitch CNN,分为四序之模,相联而织,故可由 RTNeural 运之。
报错陈情与功能祈请
若君有涉插件之祈请或遇瑕疵,请于GitHub立案.
协力共襄
协力之至,若欲增插件之能或但求文牍之善,请启PR!
许诺
《神笔》軟體及碼,依阿帕奇二零零許可證發布。觀《許可證》檔《》。《
》第三方庫所採及許可證《
》此乃《神筆》所採第三方庫之列,並其依許可證。《
- 》JUCE《》(JUCE始創)《
- 》RTNeural (BSD三條款許可證)
- ONNXRuntime (MIT許可證)
- ort-builder (MIT許可證)
- basic-pitch (Apache二.〇許可證)
- basic-pitch-ts (Apache二.〇許可證)
- minimp3 (CC0一.〇許可證)
神笔能否实时录音为文?
惜不可,缘有数事:
- 基础音调采用恒定Q变换(CQT)为输入特征。此变换需甚长音频片段(> 1秒)以得最低频段之振幅。此致延迟过高,难成实时录文。
- 基础CNN之迟滞,约加百二十毫秒.
- 音符事件生成之算法,逆时序而行(自未来溯及往昔),故非因果.
倘有良策,愿闻其详.
鸣谢
神经音符乃达米安·罗森辛与蒂博尔·瓦什所创.。 插件之界面,乃沛琳·穆勒所设计也。
。 贡献者
。 多谢诸贡献者!
- 。 贾廷·乔杜里十八:文件浏览器。
- 。
崔里皮
- :于
SCALE QUANTIZE,增其比例之选。 - 。 于音频波形及钢琴卷,施水平之缩放。
- :于
- 。 多边形。与SamuMazzi:Linux之助。













