itc語音轉(zhuǎn)寫系統(tǒng)
概述
itc語音轉(zhuǎn)寫系統(tǒng)是廣東保倫電子股份有限公司(itc)自主研發(fā)、生產(chǎn)、設(shè)計(jì)的利用人工智能技術(shù)將語音內(nèi)容轉(zhuǎn)換為文本的系統(tǒng)。
系統(tǒng)介紹
itc語音轉(zhuǎn)寫系統(tǒng)提供實(shí)時(shí)語音識(shí)別和錄音文件識(shí)別能力,實(shí)現(xiàn)語音實(shí)時(shí)轉(zhuǎn)寫、實(shí)時(shí)字幕、實(shí)時(shí)上屏、快速編輯語音轉(zhuǎn)寫紀(jì)要,并具有角色分離、錄音轉(zhuǎn)寫導(dǎo)出、紀(jì)要導(dǎo)出等功能,配合傳統(tǒng)會(huì)議室系統(tǒng)使用。
系統(tǒng)功能
實(shí)時(shí)語音轉(zhuǎn)寫
可將會(huì)議現(xiàn)場(chǎng)參會(huì)人員的發(fā)言內(nèi)容實(shí)時(shí)快速轉(zhuǎn)寫成文字,并且可以進(jìn)行文字同步編輯,在會(huì)議結(jié)束后可以快速的整理出會(huì)議記錄或紀(jì)要,讓記錄人員的錄入效率從以往最高每分鐘輸入120~150個(gè)字提升到當(dāng)前每分鐘輸入250~350個(gè)字,縮短記錄時(shí)長(zhǎng)。
歷史音頻轉(zhuǎn)寫
會(huì)議結(jié)束后,記錄人員可將會(huì)議結(jié)束后的歷史錄音文件針直接導(dǎo)入系統(tǒng)進(jìn)行轉(zhuǎn)寫進(jìn)行文字轉(zhuǎn)寫,確保會(huì)議記錄的準(zhǔn)確性。系統(tǒng)支持wma/wav/mp3/m4a/pcm/avi等多種格式音頻,轉(zhuǎn)寫結(jié)果支持錄音文字同步調(diào)聽矯正,可快速完成文字校核。一次性支持上傳50條數(shù)據(jù),數(shù)據(jù)總大小不超過5G,單條音頻時(shí)長(zhǎng)不超過18小時(shí)。
實(shí)時(shí)上屏展示
可將文字轉(zhuǎn)寫內(nèi)容通過大屏顯示給現(xiàn)場(chǎng)人員觀看,通過展板上屏、展示實(shí)時(shí)語音轉(zhuǎn)寫結(jié)果,字體顏色和展板背景顏色支持根據(jù)實(shí)際情況需要進(jìn)行調(diào)整,實(shí)現(xiàn)參會(huì)人員視聽結(jié)合。
關(guān)鍵詞優(yōu)化
針對(duì)會(huì)議的轉(zhuǎn)寫過程中,某些個(gè)性化或者生僻的詞語(例如人名、公司名、地名等)可能出現(xiàn)錯(cuò)誤的情況,后臺(tái)記錄員可以提前輸入一些關(guān)鍵詞來優(yōu)化語言識(shí)別模型,以便在后面的實(shí)時(shí)轉(zhuǎn)寫過程中,系統(tǒng)自動(dòng)修正這些文字的轉(zhuǎn)寫結(jié)果,提高識(shí)別準(zhǔn)確率。
語氣詞過濾
使用超大規(guī)模的語言模型,對(duì)識(shí)別結(jié)果語句智能預(yù)測(cè)其對(duì)話語境,提供智能斷句和標(biāo)點(diǎn)符號(hào)的預(yù)測(cè)。能夠在實(shí)時(shí)語音轉(zhuǎn)寫開始前或者進(jìn)行文稿整理時(shí),根據(jù)需要選擇是否開啟“語氣詞過濾”功能,若開啟則能將參會(huì)人員語氣詞和多余的詞匯去除,以保證文稿的規(guī)整。
禁忌詞屏蔽
系統(tǒng)管理人員可將不適宜展示的敏感詞添加禁忌詞列表中,屏蔽此禁忌詞,當(dāng)識(shí)別到此類詞匯時(shí),系統(tǒng)提供不顯示、*號(hào)和空格三種顯示方式供選擇。
重點(diǎn)內(nèi)容標(biāo)記
當(dāng)發(fā)言遇到一些重要的信息時(shí)后臺(tái)工作人員可對(duì)內(nèi)容進(jìn)行重點(diǎn)標(biāo)記,同時(shí)對(duì)領(lǐng)導(dǎo)的一些決策也可以進(jìn)行重點(diǎn)標(biāo)記,便于會(huì)議結(jié)束后的記錄查詢等。
系統(tǒng)支持在實(shí)時(shí)語音轉(zhuǎn)寫過程、對(duì)轉(zhuǎn)寫文本結(jié)果進(jìn)行編輯,對(duì)一些有疑問的內(nèi)容重點(diǎn)標(biāo)記高亮顯示,已標(biāo)記的文本也可以進(jìn)行修改和標(biāo)記取消,方便整理會(huì)議紀(jì)要,會(huì)議結(jié)束會(huì)后即可或直接成稿。
音頻文字雙向?qū)?yīng)
在會(huì)議過程會(huì)議結(jié)束后,若對(duì)會(huì)議當(dāng)時(shí)的記錄存在異議,可對(duì)當(dāng)時(shí)的歷史音頻文件進(jìn)行回放并再次轉(zhuǎn)寫,轉(zhuǎn)寫過程可以任意拖動(dòng)進(jìn)度條,并會(huì)顯示當(dāng)前進(jìn)度條所轉(zhuǎn)寫的語音文字區(qū)域?qū)崿F(xiàn)雙向?qū)?yīng),方便記錄人員復(fù)查會(huì)議記錄內(nèi)容。
播放器、時(shí)間軸及文本區(qū)互相同步定位,更方便找到錄音時(shí)間對(duì)應(yīng)的文本對(duì)照修改。語音文字雙向交互,既可通過文字定位到語音,也可通過語音定位到文字,方便進(jìn)行問題針對(duì)性的查看及修改。
角色分離
通過接入不同音頻通道實(shí)現(xiàn)角色自動(dòng)分離,每個(gè)通道對(duì)應(yīng)發(fā)言角色。實(shí)現(xiàn)在會(huì)議過程中參會(huì)人員各方發(fā)言的內(nèi)容進(jìn)行角色分離并自動(dòng)實(shí)時(shí)識(shí)別成文字。
快速會(huì)后紀(jì)要
在會(huì)議中記錄人員需要仔細(xì)聽現(xiàn)場(chǎng)參會(huì)人員的發(fā)言,并記錄他們發(fā)言內(nèi)容,在會(huì)議過后并整理存檔,可使用語音轉(zhuǎn)寫結(jié)果進(jìn)行編輯會(huì)議紀(jì)要,復(fù)制語音轉(zhuǎn)寫文本內(nèi)容到會(huì)議紀(jì)要中。會(huì)議結(jié)束后,自動(dòng)歸檔會(huì)議紀(jì)要文件。管理人員可前往歷史會(huì)議中查看會(huì)議紀(jì)要文件,下載會(huì)議紀(jì)要文件。
會(huì)議錄音
可實(shí)時(shí)錄制參會(huì)人員發(fā)言的現(xiàn)場(chǎng)音頻,方便記錄員回聽錄音。可對(duì)照轉(zhuǎn)寫文本回聽錄音,追根溯源。速記員在會(huì)議記錄過程中,因記錄不及時(shí)、發(fā)言人語速過快的情況,通過轉(zhuǎn)寫過程中打點(diǎn)標(biāo)記相應(yīng)的位置,在閉會(huì)時(shí),可以通過回聽會(huì)議音頻,再快速修正記錄內(nèi)容。
系統(tǒng)特征
依托核心語音技術(shù),準(zhǔn)確率最高可達(dá)95%以上。
整段錄音全自動(dòng)機(jī)器轉(zhuǎn)寫,1小時(shí)音頻最快5分鐘出稿。
采用獨(dú)立專業(yè)服務(wù)器,不需聯(lián)網(wǎng),避免會(huì)議內(nèi)容和信息的外泄。
采用先進(jìn)聲學(xué)模型和語言模型訓(xùn)練,。
基于有限狀態(tài)機(jī)的解碼網(wǎng)絡(luò),支持語音流實(shí)時(shí)輸出。實(shí)時(shí)轉(zhuǎn)寫,200ms內(nèi)返回結(jié)果。
實(shí)現(xiàn)在會(huì)議過程中對(duì)會(huì)議的發(fā)起方、參與方、主席、主持人、秘書等將各方發(fā)言的內(nèi)容進(jìn)行角色分離并自動(dòng)實(shí)時(shí)識(shí)別成文字。
通過提取上下文相關(guān)的語義特征,同時(shí)結(jié)合停頓、基頻信息等語音特征,來進(jìn)行子句與段落的劃分;綜合運(yùn)用上下文相關(guān)語義特征和語音學(xué)特征,解決分句與分段問題。
通過使用泛化特征并結(jié)合上下文相關(guān)語義特征和語音學(xué)特征,剔除轉(zhuǎn)寫結(jié)果中的停頓詞、語氣詞、重復(fù)詞。
會(huì)議室的會(huì)議音響系統(tǒng)可與智能會(huì)議語音轉(zhuǎn)寫系統(tǒng)統(tǒng)一結(jié)合、協(xié)同使用,直接對(duì)接。
會(huì)議發(fā)言、音頻擴(kuò)聲、會(huì)議語音實(shí)時(shí)轉(zhuǎn)寫多項(xiàng)模塊靈活疊加組合,滿足不同行業(yè)、不同會(huì)議場(chǎng)景的多功能會(huì)議需求。
應(yīng)用場(chǎng)景
適用于辦公會(huì)議、工作報(bào)告、學(xué)術(shù)講座、培訓(xùn)、采訪等多種場(chǎng)景

會(huì)議(無紙化)擴(kuò)聲系統(tǒng)
遠(yuǎn)程視頻會(huì)議系統(tǒng)
公共廣播系統(tǒng)
分布式綜合管理平臺(tái)
多媒體矩陣KVM系統(tǒng)
智慧教育系統(tǒng)
LED照明系統(tǒng)
LED顯示屏系統(tǒng)
中央控制系統(tǒng)
醫(yī)院信息化系統(tǒng)
教育
金融
地產(chǎn)
國(guó)防
醫(yī)療
消防
交通
監(jiān)獄
政府機(jī)關(guān)
企業(yè)單位
文體場(chǎng)館
能源制造
賓館酒店
超市商場(chǎng)
公園廣場(chǎng)
平安城市
政府機(jī)關(guān)
文體場(chǎng)館
能源工廠
平安城市
公園廣場(chǎng)
賓館酒店
地產(chǎn)景區(qū)
教育
醫(yī)療
機(jī)場(chǎng)車站碼頭
企業(yè)單位
酒吧、KTV
運(yùn)營(yíng)商
查看案例名錄
全球成功案例超100W個(gè)
公司介紹
品牌詮釋
聯(lián)系我們
發(fā)展歷程
資質(zhì)證書
法律聲明
塑造世界一流品牌
干貨分享
信仰創(chuàng)新的力量




itc資訊
itc服務(wù)
分享當(dāng)前頁面
itc小程序