8月21-25日,以“全媒體、高質(zhì)量、新業(yè)態(tài)”為主題的第九屆中國數字出版博覽會(huì )在京舉辦。
在本次數博會(huì )上,方正電子作為傳媒出版領(lǐng)域領(lǐng)先的提供商和服務(wù)商,展現了深耕行業(yè)30余年的專(zhuān)業(yè)積淀和創(chuàng )新技術(shù)成果,研發(fā)的“智能排版技術(shù)”還摘得2018-2019年度數字出版“創(chuàng )新技術(shù)”獎項。
與此同時(shí),在大會(huì )的三場(chǎng)分論壇上:“人工智能發(fā)展論壇”、“2019智慧教育發(fā)展國際論壇”、“第三屆期刊融合發(fā)展高峰論壇”,方正電子數字出版產(chǎn)品事業(yè)部產(chǎn)品總監楊勇、方正集團數字出版技術(shù)國家重點(diǎn)實(shí)驗室高級算法研究員謝海華、方正電子數字出版產(chǎn)品事業(yè)部產(chǎn)品總監周坤、方正電子知識服務(wù)事業(yè)部產(chǎn)品運營(yíng)及推廣總監趙婧以四場(chǎng)精彩的演講,系統的呈現了方正電子深耕數字出版領(lǐng)域的創(chuàng )新與實(shí)踐成果。
No.1人工智能發(fā)展論壇
如今,中國的人工智能產(chǎn)業(yè)在全球浪潮推動(dòng)下,已經(jīng)進(jìn)入一個(gè)嶄新的時(shí)代。
在這次由方正電子協(xié)辦的人工智能發(fā)展論壇上,來(lái)賓們圍繞人工智能?chē)鴥韧饫碚撆c實(shí)踐,積極交流人工智能在出版業(yè)應用的經(jīng)驗與進(jìn)展情況。
方正電子數字出版產(chǎn)品事業(yè)部產(chǎn)品總監楊勇及方正集團數字出版技術(shù)國家重點(diǎn)實(shí)驗室高級算法研究員謝海華,分別從實(shí)際應用及底層技術(shù)的角度,呈現了方正電子將AI用于出版的最新成果——“智能編校排系統”。
AI助力智能審校
方正電子數字出版產(chǎn)品事業(yè)部產(chǎn)品總監楊勇
楊勇表示,目前,方正電子依托國家數字出版重點(diǎn)實(shí)驗室,結合人工智能相關(guān)技術(shù),如詞法分析、句法分析等等對這套系統進(jìn)行了改良再開(kāi)發(fā),已經(jīng)將人工智能的成果切切實(shí)實(shí)地落到圖書(shū)的日常生產(chǎn)中。
方正智能審校能夠輔助編輯人員發(fā)現知識相關(guān)、格式相關(guān)、語(yǔ)境相關(guān)等常見(jiàn)及疑難問(wèn)題,幫助編輯處理稿件中常見(jiàn)的知識類(lèi)、格式類(lèi)錯誤,讓編輯把精力更多地放在內容本身以及學(xué)術(shù)上面,從而保證圖書(shū)質(zhì)量,提升審讀效率。
系統主要包括四部分功能:
■字詞類(lèi)審校
包括常見(jiàn)敏感詞,錯別字,異體字,“的、地、得”等常見(jiàn)錯誤檢查。也包括基于人工智能的易混淆詞和搭配不當檢查。
■邏輯體例審校
包含上下文查重、大綱、數學(xué)公式、圖表序號的檢查。
■格式審校
包括對千分位、全半角、標點(diǎn)符號的檢查。
■知識性審校
有針對性地面向不同學(xué)科領(lǐng)域,如面向人文社科類(lèi)的歷史紀年檢查、面向自然科學(xué)的拉丁學(xué)名檢查、面向行業(yè)的術(shù)語(yǔ)譯文檢查、名言警句檢查等等。
這套系統的開(kāi)發(fā)背景,源自于方正電子長(cháng)期以來(lái)在出版領(lǐng)域的沉淀與積累。
“我們發(fā)現很多出版社面臨著(zhù)工作強度大、重復勞動(dòng)多、出版周期長(cháng)、成本上漲快等等現實(shí)問(wèn)題。開(kāi)發(fā)方正智能輔助編校排系統是希望能為出版機構‘減負',用機器幫助‘人工作業(yè)',這套系統能為出版機構提供圖書(shū)數字化生產(chǎn)平臺,滿(mǎn)足作者、編輯、校對、排版等不同角色間跨地域、跨終端的生產(chǎn)作業(yè)需求?!睏钣抡f(shuō)。
楊勇表示,從實(shí)際的應用效果看,“智能編校排系統”不僅審校速度快,同時(shí)也很“專(zhuān)業(yè)”?!爸悄芫幮E畔到y”集成國家及行業(yè)標準,辭海及專(zhuān)業(yè)術(shù)語(yǔ),降低了專(zhuān)業(yè)圖書(shū)的審校門(mén)檻。以往需要老編輯或者外校才能看出來(lái)的錯誤,年輕編輯通過(guò)審校工具也能輕易發(fā)現,審校效率大幅提升。
除了“智能審?!?,這套系統還可以提供“智能比對”、“智能排版”服務(wù)。一本200頁(yè)的理工類(lèi)圖書(shū)稿件,使用“智能排版”只要大約3分鐘就能完成,加上人工修圖,總共5個(gè)小時(shí)完成排版。而人工大概要16個(gè)小時(shí)。不僅如此,“智能排版”還能一鍵生成PDF、WORD、DOCBOOK、EPUB等多種格式,用實(shí)力幫助編輯“減負”。
解構“智能審?!钡牡讓舆壿?/strong>
方正集團數字出版技術(shù)國家重點(diǎn)實(shí)驗室
高級算法研究員謝海華
領(lǐng)略了“智能編校排系統”的強大優(yōu)勢,在同期論壇上,方正集團數字出版技術(shù)國家重點(diǎn)實(shí)驗室高級算法研究員謝海華為大家深入解讀了“智能審?!北澈蟛捎玫乃惴凹夹g(shù),同時(shí)也展現了這項技術(shù)的更多應用前景。
謝海華表示,預訓練語(yǔ)言模型、數據增強技術(shù)、句法分析、聯(lián)合學(xué)習、實(shí)體鏈接等自然語(yǔ)言處理領(lǐng)域的前沿技術(shù)和方法,應用于解決易混淆詞誤用、搭配不當、疊字疊詞、標點(diǎn)符號誤用、引證錯誤等問(wèn)題的檢查和糾正當中。
這項技術(shù)未來(lái)研究的方向還包括:語(yǔ)法錯誤識別和糾正,專(zhuān)業(yè)及特定領(lǐng)域文獻的術(shù)語(yǔ)識別,針對命名實(shí)體的實(shí)體鏈接,以及基于知識庫、詞典的檢索?!跋嘈烹S著(zhù)技術(shù)的不斷成熟,將來(lái)能為專(zhuān)業(yè)出版提供更專(zhuān)業(yè)的技術(shù)支持?!敝x海華說(shuō)。
No.2 2019智慧教育發(fā)展國際論壇
2019智慧教育發(fā)展國際論壇主要面向高校、中小學(xué)教師等人群,圍繞教育數字出版轉型升級、融合發(fā)展等議題,探討教育出版服務(wù)教育現代化的新模式。
方正電子數字出版產(chǎn)品事業(yè)部產(chǎn)品總監周坤向來(lái)賓們介紹了針對教育出版的解決方案——方正慧云教育融合出版方案。
看方正電子如何用技術(shù)助力教育出版
方正電子數字出版產(chǎn)品事業(yè)部產(chǎn)品總監周坤
周坤表示,現如今隨著(zhù)教育政策的變化、學(xué)習者的變化以及教學(xué)過(guò)程的變化,出版社的教材出版正面臨新的壓力和動(dòng)力,教材與課程融合的需求越來(lái)越突出。
方正慧云教育融合出版方案,包括教材出版與課程出版兩大版塊。其中,教材出版以紙質(zhì)教材為中心,融合互聯(lián)網(wǎng)技術(shù),建設能幫助學(xué)生自主學(xué)習的教材;課程出版以紙質(zhì)教材為主線(xiàn)串聯(lián)課程,建設課程體系,服務(wù)于教學(xué)過(guò)程。
方正慧云融合出版方案四個(gè)特色
目前,這套出版方案已經(jīng)在北京大學(xué)出版社、國家開(kāi)放大學(xué)出版社、武漢理工大學(xué)出版社、大連海事大學(xué)出版社等多所高校出版社投入應用,幫助出版機構強化自身優(yōu)勢,打造融合出版。
No.3 第三屆期刊融合發(fā)展高峰論壇
于8月23日舉辦的第三屆期刊融合發(fā)展高峰論壇,旨在推動(dòng)期刊深度融合發(fā)展,提升期刊品牌意識及國際影響力、樹(shù)立行業(yè)融合創(chuàng )新典范、推廣融合發(fā)展經(jīng)驗。
方正電子知識服務(wù)事業(yè)部產(chǎn)品運營(yíng)及推廣總監趙婧在論壇上分享了XML數據在學(xué)術(shù)出版領(lǐng)域的應用成果,同時(shí)系統分析了基于XML技術(shù)的全流程科技出版服務(wù)平臺,在推動(dòng)學(xué)術(shù)行業(yè)生產(chǎn)力變革方面的廣闊前景。
XML數據在學(xué)術(shù)出版的應用
方正電子知識服務(wù)事業(yè)部產(chǎn)品運營(yíng)及推廣總監趙婧
“就當前中國科技期刊的發(fā)展態(tài)勢,出版方式數字化、傳播效應立體化、出版模式開(kāi)放化是大勢所趨。但目前學(xué)術(shù)刊社的排版、內容運營(yíng)流程,遠遠跟不上時(shí)代的發(fā)展步伐,變革已經(jīng)是勢在必行?!壁w婧說(shuō)。
趙婧表示,基于對國內期刊出版現狀的調研分析,方正電子推出了方正學(xué)術(shù)出版云服務(wù)平臺。以XML作為可跨平臺的數據存儲的方式,聚焦數字出版的核心,即數字內容的存儲和發(fā)布方式,為出版單位打造出一個(gè)高效智能的數字化出版平臺。
目前,此平臺已經(jīng)能夠幫助刊社實(shí)現出版過(guò)程的數字化管控、單篇稿件即刻生產(chǎn)、多種格式成品文件同步生成,大幅提高工作效率。同時(shí),平臺可以利用XML數據組建刊社自主運營(yíng)的“資源中心”,實(shí)現學(xué)術(shù)資源二次出版,助力學(xué)術(shù)傳播,形成大數據報告,推動(dòng)期刊新媒體融合發(fā)展。
“從2018年6月,方正學(xué)術(shù)出版云服務(wù)平臺正式運營(yíng)至今,已有200多種期刊完成了生產(chǎn)方式的轉變,覆蓋了北京、上海、天津、江蘇等18個(gè)省份,涉及理學(xué)、農學(xué)、工程技術(shù)、生物醫學(xué)等核心學(xué)科,并且帶動(dòng)了傳統印刷企業(yè)的轉型升級,支撐了為學(xué)術(shù)期刊提供專(zhuān)業(yè)服務(wù)的企業(yè)?!壁w婧說(shuō)。
方正學(xué)術(shù)出版云服務(wù)平臺工作原理
“在未來(lái),我們希望基于XML技術(shù)幫助刊社打造出一個(gè)全流程科技出版服務(wù)平臺,連接作者、刊社及專(zhuān)家,解決從采編、生產(chǎn)、發(fā)布、傳播直至運營(yíng)的整條生態(tài)鏈。最終目的是以此為基礎,實(shí)現行業(yè)各類(lèi)相關(guān)知識發(fā)表、集成、存儲服務(wù)一體化平臺,成為創(chuàng )新知識服務(wù)中心,用數據的力量推動(dòng)行業(yè)變革?!壁w婧說(shuō)。
XML技術(shù)應用展望
就在這屆數博會(huì )上,中國新聞出版研究院發(fā)布了《2018—2019中國數字出版產(chǎn)業(yè)年度報告》,報告顯示出版單位轉型創(chuàng )新能力提升、業(yè)態(tài)復合化趨勢漸顯都是數字出版產(chǎn)業(yè)發(fā)展的趨勢。在出版業(yè)轉型融合持續深入發(fā)展的當下,方正電子將繼續攜手傳媒出版同仁,助力出版業(yè)轉型融合不斷深化,邁向高質(zhì)量發(fā)展。