首頁 > 文章中心 > 正文

      人工智能書刊中符號和公式編排探思

      前言:本站為你精心整理了人工智能書刊中符號和公式編排探思范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

      人工智能書刊中符號和公式編排探思

      摘要:當前,新一代人工智能正在全球范圍內蓬勃發展,帶來人工智能類書刊文章近幾年以幾何級倍數增加。本文針對國內人工智能類書刊文章中符號公式編排的常見問題,結合國家標準進行思考并給出規范的表達方式,以期對作者和出版社編輯有所啟發,提高相關出版物的質量。

      關鍵詞:人工智能;書刊文章;符號;公式;編輯加工

      導語

      當前,新一代人工智能正在全球范圍內蓬勃發展,促進人類社會生活、生產和消費模式巨大變革,為經濟社會發展提供新動能,推動經濟社會高質量發展,加速新一輪科技革命和產業變革。2017年,國務院發布《新一代人工智能發展規劃》,目標是搶抓人工智能發展的重大戰略機遇,讓我國在人工智能領域構筑先發優勢。我國頂級的IT企業和一流高校陸續成立協同創新中心、人工智能研究院、人工智能學院等機構。教育方面,《新一代人工智能發展規劃》提出“實施全民智能教育項目,在中小學階段設置人工智能相關課程,逐步推廣編程教育”的要求。不少省、區、市都已經開始探索在義務教育階段開展人工智能教育。人工智能高等教育更是走在前列。2018年,教育部印發了《高等學校人工智能創新行動計劃》,將完善人工智能領域人才培養體系作為三大任務之一,并積極加大人工智能專業建設力度。在這些背景下,我國的人工智能類書刊文章近幾年以幾何級數增加,給出版單位的編輯提出了新的要求和挑戰。從人工智能的理論基礎來看,一方面,人工智能脫胎于計算機學科,是研究使用計算機來模擬智能的科學,需要用計算機程序實現這些智能應用;另一方面,當前以深度神經網絡為代表的新一代人工智能又是建立在以線性代數和概率論為框架的基礎數學之上,通過在多維上簡單地組合實現復雜的功能。因此,在人工智能類書刊文章中不可避免地會碰到大量的數學公式、物理量符號、計算機算法和程序段代碼交織在一起的情況,給編輯加工帶來一定的困擾。本文主要談談編輯加工人工智能書刊文章中的符號和公式時遇到的幾個典型問題,并簡單進行總結和歸納。[1]

      1.人工智能類書刊文章中的大、小寫

      人工智能類書刊文章中的大、小寫表示,除了人名、地名、機構等專有名詞的英文釋義需要首字母大寫,名詞英文縮寫、部分運算符號、人名引申的單位符號、集合符號等全部大寫外,其他的英文字符均建議用小寫表示。這和一般科技類書刊文章中的表示是統一的,下面舉幾個人工智能文章中的例子做具體說明。例1(1)Python語言、GPU、LeNet神經網絡——這些都是與人工智能相關的專有名詞或專有名詞縮寫,有些已經收入相關的《專有名詞詞典》或者在“術語在線”上能查到,但也有相當一部分還沒有,但是可以按照約定俗成來表示。(2)支持向量機(supportvectormachine,SVM)卷積神經網絡(convolutionalneuralnetworks,CNN)——人工智能書刊文章中出現的算法、方法、公式名稱的英文釋義一般全用小寫表示,縮寫一般全用大寫表示。(3)隱馬爾科夫模型(hiddenMarkovmodel,HMM)、蒙特卡洛樹搜索(Monte-Carlotreesearch)——英文釋義中涉及人名或者地名等專有名詞,專有名詞保持首字母大寫,其他單詞用小寫表示,縮寫還是全用大寫。(4)國際計算機視覺大會ICCV(IEEEInternationalConferenceonComputerVision)——頂級會議和機構名稱的英文釋義保留首字母大寫。人工智能類書刊文章中的大、小寫表示一般是遵循約定的原則而非通用標準,所以尺度比較寬松,編輯加工中做到同一類情況全書或全文統一也就可以了。

      2.人工智能類書刊文章中的正、斜體

      2.1量和單位

      人工智能類書刊文章中的量和單位首先要符合一般性的量和單位正規表達方式。[2]量的符號,包括物理量和計算過程中用到的變量,通常是單個的拉丁字母或希臘字母,都必須用斜體表示,如x,y,z,W,α,β,Θ等。有一種情況容易忽略,即變量出現在名詞中,如人工智能類書刊文章中會出現k-均值(k-mean)算法、n元語法(n-gram)模型等名詞,其中的k和n表示為變量,所以不管是在中文名稱還是英文釋義中都應該用斜體表示。單位符號則一律用正體表示,如厘米(cm)、千克(kg)等。人工智能書刊文章中還經常會遇到計算機中常用的單位,如比特(b)、比特率(b/s)、千比特每秒(Kb/s)、字節(B)、千字節(KB)、兆字節(MB)等。特別要注意小寫k、m和大寫K、M作為SI詞頭(加在單位前的符號)的用法,一般來說,103=k,10-3=m,106=M,但在計算機二進制中還有210=K,220=M,所以要根據上下文的準確意思來標注單位符號。人工智能書刊文章中的單位符號還有幾個通用原則需要遵循。(1)作為科技書籍或文獻,單位符號一般應全部使用英文符號,不能中文英文單位混用,除非該量只有中文單位,如計數單位“元”“人”“冊”等,計時單位“時辰”“旬”等,因為沒有對應的字母符號,所以只能用中文符號。(2)多個具有共同單位的數值并列或區間表示時,可以只在最后一項數值后保留單位符號,其他數據后省略,例如,100、200、500HZ(或100,200,500HZ),100~500b/s,1991—1995年等。(3)多個數值相乘表示面積、體積、分辨率時,每個數值的單位都應該保留,例如,體積2m×5m×3m,分辨率800px×600px等。這和上文“多個具有共同單位的數值并列”是有明顯區別的,需要特別注意。

      2.2函數、常數及運算符號

      數學公式中常見的函數、常數及運算符號一律用正體表示,如sin,cos,∑,∏,log,ln,Δ,π,e(自然對數底)等。微分號“d”和偏微分號“?”本文認為也是運算符號的一種,所以應該用正體表示。要注意的是,不能見著符號e就把它排成正體,一定要明白它代表的數學意義,e作為字母變量時應該用斜體表示,同樣的情況還是有π,∑等,這些符號也常用作變量。人工智能用到的公式除高等數學外,還涉及統計學的內容,例如統計機器學習部分的內容。統計學的運算符號一般用斜體表示,還應注意大、小寫的表示規則,如概率計算為大寫斜體P,算數平均數計算使用大寫斜體M,總體的標準差計算用小寫斜體σ等。人工智能類書刊文章中還有一類特殊的函數——激活函數,如softmax,logistic,sigmoid,tanh,ReLU等,實際處理中,作為一般的數學函數對待,不管是在正文中還是在公式中,都用正體表示。

      2.3上、下標的正、斜體

      一般原則是,物理量符號或者在計算過程中用到的變量符號出現在上、下標的時候使用斜體表示,其他均應用正體表示。[3]例2Wij,其中的ij是雙變量符號,使用斜體表示;Wi,Wo,其中i,o表示物理量的輸入、輸出狀態,使用正體表示;WT,其中的T是時間變量,使用斜體表示;WT,其中的T表示矩陣的轉置,使用正體表示。人工智能類書刊文章中變量的上、下標還會用到函數符號,如果是標準數學函數或特定的函數符號,如sin(正弦),max(最大),lim(極限),exp(以e為底的指數函數),tanh(雙曲正切)等,均用正體表示。但是,很多作者也會用到自定義的函數符號做變量的上、下標,一般來說自定義的函數在公式計算中用斜體表示,因此,用作變量的上、下標時也用斜體表示,如等。

      2.4計算機程序中的正、斜體

      人工智能類書刊文章中還會遇到大量的程序代碼,計算機執行程序時一般不區分正、斜體,所以程序代碼編排時不管是變量還是常量一律用正體表示。通常,為表述一致,程序段的注釋部分(用“#”或“/*”等標注)出現的變量也一律用正體表示,但如果在兩個程序段中間出現的沒有用“#”或“/*”等標示的語句,可以認為是正文,其中出現的變量還是要用斜體表示。

      3.人工智能類書刊文章中的黑、白體

      3.1矢量、向量、張量和矩陣

      《量和單位國家標準實施指南》[4]中規定:矢量、向量、張量和矩陣用黑斜體表示。人工智能類書刊文章中的公式會大量用到向量、張量、矩陣,但作者在寫作的時候往往會忽略標注黑體,編輯因為專業知識的限制,有時也很難判斷某些量是標量還是向量、矩陣、張量。[5]簡單的方法就是從上下文信息判斷出某些量的屬性,例如,判斷矩陣的直觀方法有轉置(T)、取模(║·║)等運算,再由這些已知的量推導出其他量的性質。但是,人工智能類書刊文章中大部分的量都無法這么簡單判斷,本文根據編輯此類書刊文章的經驗以及與相關作者的交流溝通,以機器學習和神經網絡為例給出一些編輯加工思路。單特征的回歸網絡,本質上就是一元線性問題,其計算公式就是一個線性方程:zi=xi·w+bw和b都是一個標量,每個特征x對應一個輸出z,所以都是白體。多特征的回歸網絡,其計算公式也可以簡單歸納為一個線性方程:Z=WTX+B其中,X=,即多個特征向量的矩陣,所有都是黑體。往后,更復雜的計算模型,例如多特征的多分類問題以及深度學習問題,樣本數肯定大于2,甚至是多維數據,所以輸入和輸出都應該是矩陣或張量,特征數也肯定多于一個,甚至是多維特征,所以特征和偏置也都是矩陣或張量,都應該用黑體表示。[6]例如,對具有n個訓練數據{(x1,y1)…,(xn,yn)}的神經網絡,其中(xi,yi)(1≤i≤n)分別為輸入樣本及其對應的標簽,都是向量表示。對該神經網絡進行優化,一般需要計算該神經網絡的損失函數,可表示為Loss(yi,f(W,xi))。其中,Loss是損失函數符號,因為是自定義函數,此處用的是斜體;f(W,xi)表示參數為W的神經網絡對輸入xi的預測,對卷積神經網絡而言,W表示神經元連接權重和卷積核權重等需要學習的參數。此外有個細節要特別小心,即使判定變量為向量、張量、矩陣,也不要一股腦地把此變量整個排成黑體,要注意上、下標的量的屬性。只有同樣是向量、張量、矩陣的上、下標才需要排成黑體,其余仍是白體。例如,Loss(yi,f(W,xi))中,雖然y和x都是用黑斜體表示,但下標i是用白斜體表示。

      3.2集合

      集合一般都是用大寫拉丁字母的白體表示,如A,B,X,Y,Z等,但某些特殊的集合符號需要用黑正體或空心正體(或花體)形式表示,如N或N(非負整數集),Z或Z(整數集),R或R(實數集)等。但要特別注意是集合內的元素有可能是向量或張量,這在人工智能類書刊文章中非常常見,例如輸入數據集合X={x1,x2,x3,…,xn},這時,很多作者在寫書過程中容易直接把X集合標成黑體并直接代入后面算式進行計算,混淆了數據集合和數據矩陣。其實,數據集合和數據是兩個不同的概念,集合只能參與集合運算,不能參與普通運算,直接寫進公式就寫錯了。碰到此類情況,本文有如下一種編輯加工時的修改方案。定義數據集合X={x1,x2,x3,…,xn},注意X是大寫的白體,另定義小寫黑體x=(原則上另定義大寫黑體X也可以,但是同時出現不好區分,也使讀者疑惑)或者xi(i=1,…,n)代表數據代入公式進行運算。這里的x或xi不再表示集合而是表示數據矩陣或單個數據向量、張量??梢?,符號和公式的正、斜、黑、白體看似不起眼,實則非常重要,有時不僅僅是規范性問題,還是科學性問題。[7]

      4.公式、算法偽代碼和程序段混排中的處理

      能正確標注公式中的正、斜、黑、白體已經很難了,如果再碰上公式、算法偽代碼和程序段混排的情況,那就更容易混淆了。下面通過一個例子來說明本文的處理方式。例3如果使用深度神經網絡來擬合動作─價值函數,則該算法被稱為深度Q學習?!?,是對的估計值,……,利用梯度下降法來更新參數θ。算法參數化的Q學習算法函數:DeepQLearning輸入:馬爾可夫決策過程輸出:策略π此例中的θ,從上下文來看是個多維參數,必然是向量或張量,所以正文中用黑斜體表示。本文認為算法偽代碼也是正文的一種形式,只不過加入了repeat、until、for、goto這樣的偽語句(偽語句的編排向程序段靠攏,用正體表示),所以期內的公式表述還是應該和普通正文表述保持一致。所以此例中出現的θ都統一用黑斜體表示。如果算法偽代碼后面還接了一段Python程序,其中定義了同一個變量θ,按照前文所述原則,程序內的θ按照正白體處理。[8]

      5.小結

      以上分析了人工智能類書刊文章中常見的符號使用和公式編排問題,并給出了規范性的思考。但符號和公式使用的實際情況要復雜得多,特別是人工智能涉及的公式都是抽象公式,其中變量的一符多用或多符共用的情況普遍存在,用好用準并不容易。作者和編輯要在熟悉規范的前提下,根據知識內容的實際情況,準確表達,一起提高此類書刊文章中符號和公式使用的規范性,提高成果質量,為我國新一代人工智能的發展保駕護航。

      參考文獻

      [1]國家技術監督局.GB3100~3102–93量和單位[M].北京:中國標準出版社,1993.

      [2]國家技術監督局.量和單位國家標準實施指南[M].北京:中國標準出版社,1996.

      [3]陳天驕,劉江,黃韜.人工智能在網絡編排系統中的應用[J].電信科學,2019(5):9-16.

      [4]姚瓊.科技期刊中數學公式編排的常見問題分析[J].中國多媒體與網絡教學學報(上旬刊),2019(10):247-248.

      [5]葉超.關于減少數學類文章編排錯誤的幾點思考[J].科技創新與生產力,2017(1):64-66.

      [6]論文中公式和反應式的編排規范[J].電力系統及其自動化學報,2011(3):110.

      [7]王萌.淺析科技期刊中數學公式編輯加工常見問題[J].中國傳媒科技,2020(9):96+104.

      [8]朱建新.國內外科技期刊中數學符號編排格式的對比分析[J].編輯學報,2019(01):34-36.

      作者:韓飛 單位:高等教育出版社

      亚洲一区二区免费视频| 亚洲Av无码一区二区二三区| 亚洲爆乳无码专区www| 国产91在线|亚洲| 99久久婷婷国产综合亚洲| 亚洲国产成人99精品激情在线| 亚洲综合一区二区精品久久| 亚洲一区二区在线免费观看| 99人中文字幕亚洲区| 亚洲无成人网77777| 亚洲天堂一区二区三区| 亚洲免费黄色网址| 亚洲粉嫩美白在线| 亚洲色中文字幕在线播放| 亚洲 欧洲 日韩 综合在线| 亚洲日本一线产区和二线产区对比| 亚洲色偷偷偷综合网| 亚洲乱亚洲乱妇无码| 处破女第一次亚洲18分钟| 亚洲精品成a人在线观看| 国产成人精品久久亚洲高清不卡 国产成人精品久久亚洲 | 久久夜色精品国产噜噜亚洲a| 中文文字幕文字幕亚洲色| 亚洲精华国产精华精华液网站 | 亚洲国产精品va在线播放| 亚洲VA成无码人在线观看天堂| 久久亚洲国产精品五月天| 久久亚洲国产成人精品性色| 亚洲国产精品综合一区在线| 中日韩亚洲人成无码网站| 亚洲av无码无线在线观看| 亚洲综合久久夜AV | 亚洲va中文字幕无码久久不卡| 91亚洲一区二区在线观看不卡| 亚洲最大在线视频| 亚洲久热无码av中文字幕| 亚洲国产一级在线观看| 国产亚洲成av人片在线观看| 久久精品国产亚洲AV无码偷窥| 涩涩色中文综合亚洲| 亚洲AV成人潮喷综合网|