激情六月丁香婷婷|亚洲色图AV二区|丝袜AV日韩AV|久草视频在线分类|伊人九九精品视频|国产精品一级电影|久草视频在线99|在线看的av网址|伊人99精品无码|午夜无码视频在线

高校合作1:010-59833514 ?咨詢電話:400-810-1418 服務(wù)與監(jiān)督電話:400-810-1418轉(zhuǎn)接2

用人工智能做設(shè)計,究竟能不能真的有效?

發(fā)布時間:2024-01-15 15:01:24 瀏覽量:246次

機器之心分析師網(wǎng)絡(luò)

作者:仵冀穎

編輯:Joni

在這篇文章中,我們討論設(shè)計中的人工智能問題(AI in Design)。眾所周知,人工智能 AI 的最終目的是讓機器具備與人類類似的識別、分析、理解甚至是決策的能力,從而能夠代替人類解決問題、完成任務(wù)。但是,現(xiàn)階段的人工智能,即使是在工業(yè)場景中已經(jīng)獲得了較好的推廣應(yīng)用的人工智能技術(shù),都屬于弱人工智能。

利用大量的數(shù)據(jù)學(xué)習(xí)、預(yù)訓(xùn)練、參數(shù)調(diào)優(yōu)、微調(diào)、模型架構(gòu)調(diào)整等等改進(jìn)或處理手段,這些人工智能的模型或方法能夠依賴數(shù)據(jù)或經(jīng)驗自動完成一些任務(wù),但是卻無法擁有人類的主觀能力,例如對事物、事件或者環(huán)境的感受和感知能力。它們不能夠獨立思考,因此,也不能真正具備像人類一樣的推理、類比等抽象思維的能力。

什么是設(shè)計?百科中這樣寫道:「設(shè)計是有目標(biāo)有計劃的進(jìn)行技術(shù)性的創(chuàng)作與創(chuàng)意活動, 是把一種設(shè)想通過合理的規(guī)劃、周密的計劃、通過各種方式表達(dá)出來的過程,可以把任何造物活動的計劃技術(shù)和計劃過程理解為設(shè)計?!乖O(shè)計涉及了眾多領(lǐng)域,例如:商貿(mào)領(lǐng)域(Commerce),包括產(chǎn)品設(shè)計、包裝設(shè)計等等;應(yīng)用領(lǐng)域(Applications),包括游戲設(shè)計、UI 設(shè)計等等;傳達(dá)(Communications)領(lǐng)域,包括字體設(shè)計、音效設(shè)計、圖形設(shè)計、版面設(shè)計等等;科學(xué)和數(shù)學(xué)領(lǐng)域(Scientific and Mathematical),包括組合設(shè)計、實驗設(shè)計等;物質(zhì)領(lǐng)域(Physical),包括服裝設(shè)計、環(huán)境設(shè)計、工業(yè)設(shè)計等等。不管最終的應(yīng)用領(lǐng)域是什么,設(shè)計都有一個關(guān)鍵的組成「人類的一種設(shè)想」。這種設(shè)想是典型的人類思維和思想,是完全抽象的存在,也是目前人工智能所無法替代的關(guān)鍵。因此,在設(shè)計中引入人工智能仍面臨很大的挑戰(zhàn)。

不過,盡管在設(shè)計中引入人工智能面臨很多問題,但人工智能還是有其固有的優(yōu)勢的。一是,人工智能具有超過人類的記憶能力,能夠隨時、正確的調(diào)用大量的經(jīng)驗來輔助完成任務(wù);二是,人工智能具有超強的計算能力,能夠在短時間內(nèi)完成復(fù)雜的計算任務(wù);三是,人工智能方法不受人類主觀情緒影響,能夠相對公平的評估設(shè)計方案。因此,在設(shè)計中引入人工智能將能夠不斷地積累并有效利用經(jīng)驗知識,且能夠不斷地、快速且高效地優(yōu)化設(shè)計方案,以及能夠不斷地探索并找到最佳的設(shè)計方案。

本文根據(jù)近期發(fā)表的四篇論文,具體探討了人工智能在結(jié)構(gòu)設(shè)計、產(chǎn)品設(shè)計、電路設(shè)計、排版版面設(shè)計中的應(yīng)用。這四個設(shè)計應(yīng)用領(lǐng)域的任務(wù)區(qū)別非常大,所以應(yīng)用人工智能的方法也非常不同。我們將在后續(xù)章節(jié)中具體分析不同設(shè)計任務(wù)的特點、需求,以及如何有效的將人工智能引入到設(shè)計中。

1、結(jié)構(gòu)設(shè)計中的 AI

本文重點關(guān)注的是結(jié)構(gòu)設(shè)計問題,具體是指醫(yī)院病房的房間布局設(shè)計 [1]?;颊咴谧≡浩陂g出現(xiàn)跌倒的情況會嚴(yán)重影響患者的預(yù)后,導(dǎo)致發(fā)病率增加、住院時間延長和生活質(zhì)量降低等問題。此外,不必要的跌倒也會給患者和醫(yī)療系統(tǒng)帶來巨大的經(jīng)濟(jì)成本。導(dǎo)致患者跌倒的原因有很多。其中,環(huán)境危害(Environmental Hazards)和事故(Accidents)已被確定為最常見的跌倒原因。

文獻(xiàn)[6] 中提出了一種考慮房間布局的病人在醫(yī)院房間內(nèi)自然行走時跌倒風(fēng)險的度量方法。該方法通過考慮房間設(shè)計因素,包括照明、地板類型、門的操作 (擺動或滑動) 和房間內(nèi)的支撐物 (如家具、扶手、床欄等) 來估計病人在房間中的跌倒風(fēng)險。然而,作者所提出的度量標(biāo)準(zhǔn)所定義的跌倒風(fēng)險與房間布局之間的公式關(guān)系復(fù)雜且不直觀,同時不能手動調(diào)整布局以降低跌倒風(fēng)險。

本文在 [6] 中跌倒模型的基礎(chǔ)上,采用無梯度優(yōu)化技術(shù)自動生成醫(yī)院房間布局的設(shè)計方案,目的是能夠通過改進(jìn)房間布局設(shè)計的方式降低患者跌倒的風(fēng)險(見圖 1)。具體來說,作者對模擬退火方法進(jìn)行了調(diào)整,以優(yōu)化多個真實世界醫(yī)院房間的特征,包括病人床、沙發(fā)、病人椅、輸液桿、馬桶和水槽等物體的位置,房間內(nèi)照明的位置,以及主門和浴室門的位置等,即,引入人工智能輔助進(jìn)行房間布局的結(jié)構(gòu)設(shè)計。

圖 1. 傳統(tǒng)和優(yōu)化的房間布局對跌倒風(fēng)險的評價。圖 (a) 和(b)為房間示意圖,圖 (c) 和(d)為跌倒風(fēng)險模型評估的相應(yīng)跌倒風(fēng)險熱力圖。

1.1 結(jié)構(gòu)設(shè)計中的人工智能介紹

結(jié)構(gòu)設(shè)計中的人工智能與計算機化布局規(guī)劃(Computerized layout planning)問題相關(guān)。計算機化布局規(guī)劃是指在滿足一系列標(biāo)準(zhǔn)和約束條件和 / 或優(yōu)化一些目標(biāo)的同時,利用計算機來分配空間。自 20 世紀(jì) 60 年代基于規(guī)則的計算機布局規(guī)劃理念初見端倪以來,對計算機布局規(guī)劃的需求不斷增加。此后,人們在計算機布局規(guī)劃方面做了很多工作,包括一些商業(yè)化產(chǎn)品。例如,Spacemaker(
https://www.spacemakerai.com/)、Planner 5D(https://planner5d.com/)等等。這些軟件包利用數(shù)學(xué)建模、人工智能和建筑城市發(fā)展方面的技術(shù),協(xié)助建筑師設(shè)計多建筑住宅用地和高層規(guī)劃。

在空間分配和布局規(guī)劃中,人們關(guān)注的是消耗空間的物體和資源的物理位置安排。除此之外,計算機布局規(guī)劃也常應(yīng)用于室內(nèi)設(shè)計中的物體放置問題。我們比較熟悉的有宜家開發(fā)的 IKEA PLACE 平臺,通過手機攝像頭掃描的區(qū)域內(nèi),虛擬放置公司的產(chǎn)品(Ikea apps - ikea.
https://www.ikea.com/us/en/customer-service/mobile-apps/.)。

醫(yī)院科室布局規(guī)劃是醫(yī)療機構(gòu)計算機布局規(guī)劃中的重點研究領(lǐng)域之一。本文重點討論了醫(yī)院房間內(nèi)家具、照明和門洞的擺放,目的是通過合理的規(guī)劃布局設(shè)計,以降低患者跌倒的風(fēng)險。

1.2 方法介紹

一個典型的單人床醫(yī)院房間由兩個子房間組成,一個是主房間,包括了病人、訪客和臨床區(qū)域。一個是浴室,包括了廁所、淋浴和洗臉池。作為本文方法的輸入, 房間邊界的幾何形狀是根據(jù)建筑學(xué)的要求確定的(本文使用的房間幾何形狀見圖 1)。對于每一個子房間,必須放置特定的家具物品,必須包含光源來照亮房間,必須有連接浴室與主房間的門廊和連接主房間與走廊的門廊。本文模型的目標(biāo)是對家具、光源和門廊的位置設(shè)計進(jìn)行了優(yōu)化,以降低患者跌倒的風(fēng)險。

借用約束滿足問題中的符號,作者將本文方法的輸入形式化為三個集合:(1)房間的一組 n 個可變對象(如:家具、光源和門):X=;(2)為 X 中每個變量定義的一組域:D=;(3)一組定義在 X 中變量上的約束條件:C,其中,每個約束條件都可以涉及任何變量的子集。對于 X 中的每個對象 x_i,將其在醫(yī)院房間中的位置參數(shù)化為配置向量 d_i∈ D_i。然后,將整個醫(yī)院房間的布局參數(shù)化為向量 l= [(d_0)^T , (d_1)^T , ... (d_n)^T]^T ,即 X 中每個對象的配置向量的并集。本文優(yōu)化目標(biāo)是在滿足約束條件的前提下,確定醫(yī)院房間的具體布局 l,同時將「與患者跌倒風(fēng)險」相關(guān)的函數(shù) l 最小化。

房間的整體跌倒風(fēng)險分布是根據(jù)以前對醫(yī)院跌倒風(fēng)險的研究,計算出病人的一系列外在因素的函數(shù)。該跌倒風(fēng)險模型考慮了受房間內(nèi)設(shè)施位置影響的靜態(tài)和動態(tài)因素,并提供了兩個跌倒風(fēng)險評估:(1) 房間基線評估,根據(jù)以下靜態(tài)因素計算:地板類型、照明條件、門的操作、周圍物體 (如扶手、椅子、醫(yī)療架、沙發(fā)、水槽、馬桶和床) 的支撐或危險作用,從而得出整個房間的風(fēng)險分布。(2)基于運動的評估,考慮患者的步態(tài)動態(tài)特性,如轉(zhuǎn)身角度和活動類型,如坐到站、走、轉(zhuǎn)身、站到坐等。跌倒風(fēng)險模型的完整流程見圖 2。

圖 2. 完整的跌倒風(fēng)險模型流程圖[6]

跌倒風(fēng)險模型的輸入為有關(guān)房間的細(xì)節(jié),如地板表面類型以及房間的布局,包括照明、所有物體的位置和配置以及門的位置。輸出是一個風(fēng)險分布 r( l ),定義為離散化病房的網(wǎng)格圖中每個元素的值。在模型的基線層中,每個網(wǎng)格的基值為 1,然后根據(jù)距離最近的支撐物體的距離以及照明、地板、門的操作因素來更新該值。對于基于運動的評估,該模型使用一組預(yù)先定義的場景,如患者從床上到廁所的轉(zhuǎn)換,然后預(yù)測每個場景的物體之間的樣本軌跡。模擬軌跡所經(jīng)過的每個網(wǎng)格單元都會受到具體的模擬活動(如坐立)和動態(tài)因素(如角速度和轉(zhuǎn)彎角度)的影響。由于兩個目標(biāo)對象之間可能存在多個軌跡,因此模型會生成并評估模擬患者軌跡的分布。結(jié)合基線和基于運動的評估風(fēng)險曲線,得到整個房間的跌落風(fēng)險分布。為此,計算基線跌落風(fēng)險因素的平均值和每個網(wǎng)格單元上鋪設(shè)的軌跡 / 活動點的跌落風(fēng)險。最后輸出的是每個網(wǎng)格單元的風(fēng)險值。最后,可以將跌倒風(fēng)險模型的輸出可視化為醫(yī)院房間布局的熱力圖,以顯示跌倒風(fēng)險值的分布情況(如圖 1 所示)。

本文所使用的代價函數(shù)如下:

其中,α表示用戶指定的截止參數(shù),用于確定在分布中從哪里開始考慮曲線尾部下的區(qū)域,具體如圖 3 所示。公式中的第三項表示風(fēng)險值高于α的網(wǎng)格單元的集合??紤]曲線尾部下面積是財務(wù)風(fēng)險管理中的常見做法,即所謂的條件風(fēng)險值。最終的代價函數(shù)就是跌倒風(fēng)險分布的中位數(shù)、平均值、標(biāo)準(zhǔn)差和最大值的函數(shù)。

圖 3. 跌倒風(fēng)險分布的代價函數(shù)參數(shù),顯示中位數(shù)、最大值和高風(fēng)險尾部下面積。

作者使用模擬退火來優(yōu)化 r( l )。模擬退火是一種隨機迭代優(yōu)化方法。在每次迭代時,隨機生成當(dāng)前布局附近的布局,并評估其代價。如果新的布局比當(dāng)前布局有所改進(jìn),則將其更新為當(dāng)前最新布局。如果沒有改進(jìn),根據(jù) Metropolis 概率,仍然可以接受它為最新布局:

其中,k 為 Boltzman 常數(shù),T 為根據(jù)冷卻計劃隨時間衰減的溫度值,c 代表與布局相關(guān)的代價值。詳細(xì)的優(yōu)化流程見 Algorithm 1。

在執(zhí)行優(yōu)化過程中,當(dāng)同時生成隨機的初始可行房間布局 (Alg.1 行 8) 和附近可行布局 (Alg.1 行 16,NearbyFeasLayout) 時,首要保證的是這些布局是可行的,即滿足約束集 C 中所有的約束條件。在這兩種情況下,作者采用隨機抽樣與回溯的方法,在初始房間布局的生成過程中,從每個變量的域中均勻地隨機采樣。當(dāng)生成現(xiàn)有布局的附近布局時,從以現(xiàn)有布局的配置為中心的正態(tài)分布中對每個變量的配置進(jìn)行采樣,并為每個變量定義標(biāo)準(zhǔn)差(Alg.1 中的σ_r)。為了確保在此過程中滿足約束條件,作者利用了回溯搜索方法?;厮菟阉鞣椒看螢橐粋€變量賦值并檢查是否滿足約束。當(dāng)一個變量賦值違反約束條件時,回溯搜索方法重新采樣,當(dāng)一個變量沒有合法的值可供賦值時,或者在試圖賦值該變量時發(fā)現(xiàn)已經(jīng)達(dá)到最大迭代次數(shù)或已耗費最大時間時,該方法會回溯到重新賦值之前的變量。

圖 4 給出了在醫(yī)院房間中放置一個物體時的回溯示例。在圖 4a 中,算法試圖將其中一個物體放置在浴室中,但由于前面物體的存在導(dǎo)致它無法做到這一點。該方法回溯并考慮更改先前放置物體的位置(圖 4b)。最后,在滿足約束條件的情況下,算法成功地將物體放置在房間里(圖 4c)。圖 5 描述了回溯算法的整體流程。

圖 4. 物品放置程序。(a) 先前放置的物體妨礙后續(xù)物體的可行放置。(b)回溯改變先前放置的對象的位置。(c) 所有物體都以滿足約束條件的方式放置。

圖 5. 回溯方法流程圖

1.3 實驗介紹

為了評估所提出的模型的性能,作者優(yōu)化了兩種常見類型的醫(yī)院房間的內(nèi)部配置:內(nèi)室(Inboard rooms)和外室(Outboard rooms)。對于內(nèi)室和外室的實驗,定義 X 包括:由沙發(fā)、病床、病椅、探視椅、移動醫(yī)療架、馬桶和水槽組成的家具;主室和衛(wèi)生間的吸頂燈;連接衛(wèi)生間與主室和主室與走廊的門。

在圖 6 和圖 7 中,作者分別展示了優(yōu)化前和優(yōu)化后具有代表性的內(nèi)室和外室房間布局,以及它們相關(guān)的跌倒風(fēng)險得分熱力圖。在文章最開始的部分展示的圖 1 中,作者也給出了類似的布局設(shè)計。作者發(fā)現(xiàn),與內(nèi)室房間相比,優(yōu)化外室房間時的成本值更低。

圖 6. 跌倒風(fēng)險的房間布局評估和優(yōu)化。(a)和 (b) 為算法生成的內(nèi)室房間示意圖。(a)是初始房間布局的實例,(b)是其中一次運行的優(yōu)化房間布局。(c)和 (d) 是跌倒風(fēng)險模型評估的相應(yīng)跌倒風(fēng)險熱力圖。圖 (c) 和(d)中的顏色條數(shù)值越高,說明跌倒風(fēng)險越高。

圖 7. 跌倒風(fēng)險的外室房間布局評估和優(yōu)化。(a)和 (b) 為算法生成的內(nèi)室示意圖。(a)是初始房間布局的實例,(b)是其中一次運行的優(yōu)化房間布局。(c)和 (d) 顯示了由跌倒風(fēng)險模型評估的相應(yīng)跌倒風(fēng)險熱力圖。顏色條上的數(shù)值越高,說明跌倒風(fēng)險越高。

2、產(chǎn)品設(shè)計中的 AI

2.1 產(chǎn)品設(shè)計中的人工智能介紹

設(shè)計思維是從最終用戶的角度創(chuàng)造創(chuàng)新產(chǎn)品的一個成熟過程,通常被稱為以用戶為中心的設(shè)計(User-centered design)或以人為中心的設(shè)計(Human-centered design)。這篇文章介紹的就是我們最熟悉的產(chǎn)品設(shè)計中的 AI[2]。盡管創(chuàng)新的設(shè)計思維具有無可爭議的優(yōu)點,但是對于在線業(yè)務(wù)來說,由于與產(chǎn)品開發(fā)過程或機器學(xué)習(xí)系統(tǒng)不兼容,目前很難在其中引入設(shè)計思維。本文的研究目的是提出一個過程框架,將設(shè)計思維與開發(fā)過程結(jié)合起來,將人融入到設(shè)計過程的循環(huán)(Loop)中。這就涉及了人機回圈問題(Human-in-the-loop,HITL)。

人機回圈是人工智能的一個分支,它利用人類和機器智能來創(chuàng)建機器學(xué)習(xí)模型。從本質(zhì)上講,人機回圈將自動化的問題重新定義為了人機交互(Human-Computer Interaction,HCI)設(shè)計問題。人機回圈將 「如何構(gòu)建一個更智能的系統(tǒng)?」 的問題擴(kuò)大到「如何將有用的、有意義的人機交互納入系統(tǒng)中?」這種系統(tǒng)設(shè)計的目的是實現(xiàn)能夠增強或提高人類完成任務(wù)的能力的交互式機器學(xué)習(xí)(Interactive Machine Learning),人機回圈作為一種工具通過智能地跟蹤隨時間的變化和中間結(jié)果,可以實現(xiàn)快速迭代、快速響應(yīng)的反饋、內(nèi)省和調(diào)試以及后臺執(zhí)行和自動化。關(guān)于人機回圈的問題,機器之心之前有過專門的報道,感興趣的讀者可以查閱(
https://www.jiqizhixin.com/articles/2020-11-11-6)。

為什么將人機回圈整合到機器學(xué)習(xí)系統(tǒng)中變得越來越重要?其根本原因是近年來人工智能研究成果的爆炸式增長導(dǎo)致人們對這些研究成果的有效性越來越懷疑。除了對再現(xiàn)性和可解釋性的關(guān)注,人們聚焦于一個新的關(guān)注點:可控性,即需要將人整合到依賴于機器學(xué)習(xí)結(jié)果的過程中,即人機回圈。

本文所提出的過程框架應(yīng)用心理測量學(xué)來理解用戶的設(shè)計感知,為后續(xù)的設(shè)計周期生成反饋,并逐步更新機器學(xué)習(xí)模型,以適應(yīng)在線應(yīng)用中用戶偏好的快速變化。作者認(rèn)為,目前提供在線應(yīng)用的公司無法實施設(shè)計思維方法的內(nèi)在原因可能在于對設(shè)計思維過程的誤解。例如,IDEO 在 2007 年引入的斯坦福 d.school 設(shè)計思維過程[7],規(guī)定了一個由強調(diào)、定義、構(gòu)思、原型和測試五個過程階段組成的循環(huán)。許多公司的第一個誤解就是忽視了設(shè)計的周期性,將五個階段一次性執(zhí)行。此時,最后的測試階段并不會連接到后續(xù)的學(xué)習(xí)周期。然而,周期性的特性可以很容易地通過敏捷過程(agile process)來實現(xiàn),即迭代和增量開發(fā)過程。第二個誤解是企業(yè)沒有將設(shè)計思維作為一個迭代學(xué)習(xí)周期來實現(xiàn)。設(shè)計思維方法通常將定性用戶測試的樣本量確定為 5 到 10 人之間。由于測試階段只執(zhí)行一次,小樣本量會導(dǎo)致反饋不具代表性,因此對產(chǎn)品決策有風(fēng)險。也正因為如此,這些提供在線應(yīng)用的公司和企業(yè)認(rèn)為無法在其產(chǎn)品設(shè)計過程中引入設(shè)計思維方法。

2.2 方法介紹

本文提出了一個過程框架—人在學(xué)習(xí)循環(huán)(
Human-in-the-learning-loop,HILL)。如圖 8 所示,它由一個設(shè)計思維過程(Design sprint)組成,并合并到了一個敏捷開發(fā)過程中。該過程通過對用戶反饋的定量測量來代替定性的用戶測試。這種替換能夠為后續(xù)的學(xué)習(xí)周期提供可擴(kuò)展的教學(xué)反饋。

作者使用 HILL 設(shè)計周期(The HILL Design Cycles)過程取代了定性用戶測試的定量心理測量工具的設(shè)計感知。所生成的用戶反饋用于訓(xùn)練機器學(xué)習(xí)模型,并沿著四個設(shè)計維度(新穎性、能量、簡單性、工具性)指導(dǎo)后續(xù)的設(shè)計周期。將四維用戶反饋映射為用戶場景(User stories)和優(yōu)先級(priorities),Design sprint 將用戶反饋直接轉(zhuǎn)化為實現(xiàn)過程。(Design sprint 是谷歌開發(fā)的基于敏捷過程的設(shè)計思維方法)。

圖 8. HILL 過程框架:將最終用戶的人機回圈集成到基于機器學(xué)習(xí)的分析過程中。

對于用戶測試,團(tuán)隊首先確定公司的最終用戶池,并在設(shè)計 sprint 端邀請該用戶池中的一部分用戶來完成在線調(diào)查。在線調(diào)查給出了在前面的設(shè)計 sprint 中產(chǎn)生的新原型(參見圖 9)。受邀的調(diào)查參與者評估了設(shè)計感知測量工具中關(guān)于展示的新原型的 12 個項目。此外,調(diào)查還征求了參與者的定性反饋,例如有關(guān)功能細(xì)節(jié)的問題等等。

敏捷過程的主要特征是迭代和增量的開發(fā)方法。這意味著產(chǎn)品開發(fā)過程不是像瀑布模型那樣由一系列長的后續(xù)階段定義的,而是一系列稱為迭代的短時間周期。Scrum(一種最常見的敏捷方法)稱這些迭代為 sprint。谷歌開發(fā)了基于敏捷過程的設(shè)計思維方法,并稱之為 Design sprint。實施團(tuán)隊可以根據(jù)客戶對上一次 sprint 結(jié)果的反饋來定義當(dāng)前 sprint 的范圍。這樣,新的范圍就會被充實到用戶場景(User stories)中,即從用戶角度制定的需求。所有用戶場景都將根據(jù)客戶反饋確定優(yōu)先級。

圖 9. 通過設(shè)計感知調(diào)查進(jìn)行用戶測試。

本文通過以下方式對設(shè)計感知調(diào)查的反饋進(jìn)行分析。根據(jù)新穎性、能量刺激性、簡單性、工具創(chuàng)造性四個設(shè)計維度對用戶反饋進(jìn)行分組。對于每個設(shè)計維度,計算其綜合得分,并給出箱線圖的可視化結(jié)果(圖 10)。人機回圈部分是由人類質(zhì)控工程師來實現(xiàn)的。質(zhì)控工程師仔細(xì)檢查所接收到的用戶反饋的數(shù)據(jù)質(zhì)量,丟棄掉無效數(shù)據(jù),如異常值或包含強默認(rèn)偏差的反饋。這個數(shù)據(jù)清理過程對于只保留有效的新數(shù)據(jù)并將其添加到訓(xùn)練機器學(xué)習(xí)模型的數(shù)據(jù)集中是至關(guān)重要的。所得到的模型可以作為快速仿真的預(yù)訓(xùn)練模型,以支持原型決策。

圖 10. 基于設(shè)計感知分析的設(shè)計維度反饋生成與機器學(xué)習(xí)模型更新。

Design sprint 過程由四個設(shè)計維度構(gòu)成,每個設(shè)計維度對應(yīng) sprint 腳本中的一個類別(參見圖 11)。類別(例如簡單性)對應(yīng)領(lǐng)域或業(yè)務(wù)需求的高級抽象。團(tuán)隊根據(jù)設(shè)計維度的綜合得分來分配每個類別的優(yōu)先級 --- 最低的得分給出最高的優(yōu)先級,因為它揭示了最嚴(yán)重的缺陷。在設(shè)計維度的優(yōu)先級下降時,團(tuán)隊決定在即將到來的 sprint 中處理哪些設(shè)計維度。對于這個決定,團(tuán)隊不必考慮實施的難易程度,因為后者反映在后面的工作量估算過程中。這意味著更容易實現(xiàn)的用戶場景將獲得更少的工作量估計單位,因此更可能實現(xiàn)。

團(tuán)隊為選定的設(shè)計維度編寫用戶場景。例如,category simplicity 中的用戶場景可以表述為「作為一個前端 web 用戶,我希望以盡可能少的導(dǎo)航步驟導(dǎo)航到我的個人頁面」。在編寫此類用戶場景時,團(tuán)隊將定性用戶反饋整合到用戶場景的接受標(biāo)準(zhǔn)中。例如,如果用戶反饋暗示顏色不一致,那么用戶場景在 category simplicity 中的接受標(biāo)準(zhǔn)可以表述為「檢查所有 UI 元素是否來自相同的顏色方案」。

基于用戶場景,團(tuán)隊執(zhí)行敏捷工作估算過程(Agile effort estimation process),并相應(yīng)地調(diào)整 sprint 范圍。然后,執(zhí)行任務(wù)分解(task breakdown),即團(tuán)隊成員將用戶場景中定義的范圍分解為必須執(zhí)行的小任務(wù),以實現(xiàn)用戶場景。任務(wù)分解之后,回顧團(tuán)隊對當(dāng)前 sprint 范圍的理解,并結(jié)束 sprint 規(guī)劃(sprint planning)。

圖 11. 基于設(shè)計維度反饋的 Sprint Planning。

團(tuán)隊是一個自組織的團(tuán)隊,它通過正常的敏捷迭代方式來執(zhí)行 Design sprint。在這個過程結(jié)束時(參見圖 12),團(tuán)隊會在隨后的調(diào)查中展示其設(shè)計結(jié)果,這是因為用戶必須能夠從在線的應(yīng)用顯示中發(fā)現(xiàn)并掌握應(yīng)用的新功能。這種關(guān)注需要執(zhí)行額外的活動,比如從不同的視角拍攝照片或制作效果圖,直到用戶能夠在他們的在線調(diào)查顯示中掌握到新原型的要點(參見圖 12,圖 12 中底部中間顯示的原型)。

圖 12. Design sprint 的新設(shè)計原型。

3、版面設(shè)計中的 AI

本文討論的是版面設(shè)計中視覺文本版面布局(Visual-textual presentation layouts)的自動生成問題[5]。隨著互聯(lián)網(wǎng)的發(fā)展,人們對社交媒體無處不在的訪問和使用,使其創(chuàng)建和共享的富媒體(rich-media)內(nèi)容比以往任何時候都要多,無論是為了體驗共享還是產(chǎn)品推廣。發(fā)布富媒體內(nèi)容的一個重要任務(wù)是設(shè)計一個由異構(gòu)媒體元素(例如,圖像和文本描述)組成的具有視覺吸引力的展示布局(Presentation Layout)。因此,視覺文本版面布局的設(shè)計無處不在,從現(xiàn)有的商業(yè)印刷出版物,到在線數(shù)字雜志,再到個人媒體帖子。

如圖 13 的示例。圖 13(a)給出了使用本文提出的方法自動生成的布局,它能夠反映出真實雜志封面中使用的許多設(shè)計原則,如圖 13(b)所示。在各種視覺文本版面布局中,雜志封面體現(xiàn)了最全面的設(shè)計理念。本文提出了一個結(jié)合高級美學(xué)原則(自上而下的方式)和低級視覺特征(自下而上的方式)的版面布局計算框架。為了驗證本文提出的框架的有效性,作者從設(shè)計師提供的復(fù)雜雜志封面中導(dǎo)出了一組模板,并將模板應(yīng)用到計算框架中以生成相應(yīng)的視覺文本布局。在本文提出的框架中,這些模板可以很容易地修改和擴(kuò)展到其他出版物中。

圖 13. 視覺文本版面展示布局示例:(a)根據(jù)本文方法自動生成的布局和(b)真實雜志封面的布局。本文工作目標(biāo)是從給定的圖像和文本自動創(chuàng)建一個專業(yè)的布局。

3.1 生成模板

本文首先生成了一套主題相關(guān)的模板。這些模板能夠用于在空間布局和色彩協(xié)調(diào)過程中指導(dǎo)設(shè)計,從而確保令人滿意的布局性能。模板由兩個方面定義:空間布局和主題相關(guān)風(fēng)格。在空間布局中考慮了黃金分割分布的對稱和不對稱視覺平衡以及空間的藝術(shù)性,并將主題相關(guān)的字體情感、字體大小約束、語義色彩、色彩調(diào)和模型等融入到設(shè)計風(fēng)格中。作者將版面元素定義為 「刊頭」、「標(biāo)題」、「封面線」和「副標(biāo)題」。對于每種類型的元素,作者在圖像的百分比范圍內(nèi)預(yù)先定義一些顯示在黃色區(qū)域中的 mask 區(qū)域。在 mask 區(qū)域中考慮了空間布局的美學(xué)原則。圖 14 給出了 「時尚」 和「餐飲」主題的兩個版面模板。圖 14(b)的設(shè)計假設(shè)當(dāng)一個顯著的對象位于圖像的左下角時,文本應(yīng)該被限制在預(yù)定義的區(qū)域內(nèi),這些區(qū)域引導(dǎo)文本元素按照從上到下的順序進(jìn)行展示。

圖 14. (a)「時尚」和(b)「食品和飲料」模板中的示例。每個模板都包括空間布局、字體系列、高度限制和語義顏色。所定義的空間布局中的文本區(qū)域可以根據(jù)圖像重要性而變化。

作者定義了 16 種常見的空間布局,涵蓋了 8 個最常用的主題。對于每個主題,作者設(shè)計了 20 種語義顏色、4 種字體情感模板和一到兩種顏色調(diào)和模型的主題相關(guān)樣式。并遵循以下幾點設(shè)計原則:

文本信息完整性:要使雜志封面視覺完整,文本元素不應(yīng)超出背景圖像的邊界或相互重疊。

視覺信息最大化:圖像應(yīng)調(diào)整到目標(biāo)分辨率,同時保留重要的視覺信息(即圖像區(qū)域),如人臉、文本、顯著對象、人類參與區(qū)域等。此外,嵌入的文本元素不應(yīng)遮擋顯著區(qū)域。

空間布局的合理性:要制作出自然、吸引人的雜志封面,文本元素的定位應(yīng)遵循美學(xué)原則。例如,對稱平衡遵循人類審美感知中的關(guān)鍵規(guī)則,即文本應(yīng)該放置在背景圖像的空白處。

感知一致性:重要的文本應(yīng)該以更獨特的文本大小、字體和更高的對比度顏色,在不顯著的區(qū)域中更有吸引力地顯示出來。

色彩協(xié)調(diào):從視覺感知的角度來看,文本元素的色彩應(yīng)該是和諧的、吸引人的。

文本信息的可讀性:為了使讀者一眼就能理解,需要設(shè)置適當(dāng)大小的文本元素。同時,文本元素和背景圖像之間的顏色對比可以提高文本信息的可理解性。

3.2 計算框架

本文設(shè)計了一個計算框架來整合版面設(shè)計的所有關(guān)鍵元素,包括版面模板、高級美學(xué)原則(自上而下的方式)和低級圖像特征(自下而上的方式)。作者將排版問題描述為一個模板約束的能量最小化問題。

除了上一節(jié)中討論的預(yù)定義的布局模板外,自動生成視覺文本布局的過程還應(yīng)該考慮到基于內(nèi)容的圖像特征(如顯著性圖)。通過結(jié)合高級模板約束和低級圖像特征,作者定義了一個計算框架,如圖 15 所示。該框架包括四個主要模塊:(i)素材生成器,用戶可以直接上傳圖片和文本,也可以對網(wǎng)頁進(jìn)行分析,獲得主要圖片和關(guān)鍵句子;(ii)圖像合成,自動裁剪和縮放原始圖像,以匹配目標(biāo)版面大小;(iii)排版優(yōu)化,在選定版面模板的空間約束下,將文本覆蓋在調(diào)整大小的圖像上;(iv)文本顏色設(shè)計,在考慮全局顏色協(xié)調(diào)和局部可讀性的情況下,以主題相關(guān)的樣式重新存儲文本。

圖 15. 基于主題相關(guān)模板的可視化文本版面自動生成框架。

3.2.1 圖像合成

該算法根據(jù)目標(biāo)分辨率對原始圖像進(jìn)行裁剪和縮放,同時能夠檢測到并保存重要的區(qū)域。這些區(qū)域包含關(guān)鍵信息,如人臉、文本、突出物體和人類注意力。如圖 16 所示,作者對輸入圖像應(yīng)用顯著性檢測、OCR 和人臉檢測。相應(yīng)地,計算出顯著性、人臉、文本和注意力圖,并將視覺感知圖定義為所有圖中的最大操作。通過最大化與圖像 I 具有相同縱橫比的裁剪 mask 下重要性值實現(xiàn)從分辨率為 [w_o, h_o] 的圖像 I_o 到分辨率為 [w, h] 的圖像 I 的圖像合成,然后再將裁剪后的圖像縮放到分辨率 [w, h]。此外,在檢測側(cè)面輪廓時作者引入了注視注意力(Gaze attention),從而得到人眼在圖像上的位置和頭部的方向。然后,可以很容易地計算出注視方向,通過它我們可以估計出圖 15 所示的注視注意力圖。重要性圖定義為對顯著圖、人臉圖和文本圖的最大操作。通過對注視 - 注意力圖和重要性圖進(jìn)行 T 變換,得到了分辨率為[w, h] 的注視 - 注意力圖 I_a 和重要性圖 I_m,這對后續(xù)的排版過程是非常有用的。

3.2.2 排版

圖 16. 排版過程:(a)視覺重要性圖(灰色)與注視注意力(黃色);(b)從排名前 5 位的模板中選擇模板;(c)輸入文本;(d) 排版程序的細(xì)節(jié),其中通過迭代控制正面高度(例如,「封面線」)在次優(yōu)化解決方案中最小化定義為 E(L)的能量;(E)排版結(jié)果具有自下而上的圖像特征和自上而下的空間布局約束。

圖 16 給出了完整的排版過程。視覺文本布局的排版是將文本疊加到背景圖像上的過程。從人類的視覺感知來看,句子在圖像上的表現(xiàn)通常被視為一個文本塊。作者將此文本塊的輪廓定義為相應(yīng)句子的邊界框,參見圖 16 中圖像(e)的紅色矩形。作者將排版問題描述為一個能量優(yōu)化問題,在自動選擇模板的約束下,最小化文本疊加的代價、多余視覺空間的浪費以及信息重要性在感知和語義上的不匹配程度。

3.2.3 和諧色彩設(shè)計

文本和圖形元素的色彩設(shè)計一直是創(chuàng)造高質(zhì)量視覺文本布局的一大挑戰(zhàn)。由于人們對顏色非常敏感,和諧的顏色可以產(chǎn)生一種悅目的觸感來吸引用戶的注意力,并為長時間的閱讀提供良好的體驗。和諧色彩設(shè)計的兩個要求是:1)保持文本顏色與背景圖像的整體協(xié)調(diào),2)保持文本的局部可讀性。為了滿足這些需求,作者利用設(shè)計師總結(jié)出的語義色彩和一些著名的色彩調(diào)和模型,在調(diào)和色彩設(shè)計中采用主題相關(guān)模板,提供了一種有效的色彩設(shè)計方法。

如圖 15 所示,從調(diào)整大小的圖像中提取調(diào)色板。調(diào)色板由七種顏色組成,其中前四種來自顯著對象,另外三種來自非顯著對象。同時通過圖像主題識別出文本的語義顏色,用于監(jiān)督文本顏色的生成。根據(jù)模板中主色的定義,從調(diào)色板中選擇主色。在一定的色調(diào)調(diào)和模板中,對語義顏色進(jìn)行迭代,計算出與主顏色的匹配分?jǐn)?shù)。提取響應(yīng)最大(匹配分?jǐn)?shù)最高)的顏色作為文本的基色。為了滿足第一個要求,作者采用「i」型色調(diào)調(diào)和模板來控制其他文本的色調(diào)。在確定每個文本的色調(diào)后,作者采用一定的色調(diào)模型來保證與背景有足夠的視覺對比度。

圖 17 演示了「時尚」主題中圖像的色彩設(shè)計過程。在「時尚」話題中,主色調(diào)被定義為最常出現(xiàn)在顯著區(qū)域的顏色。據(jù)此,選擇調(diào)色板中的第一種顏色作為主色,主色反映視覺部分中的基色。通過在本主題中應(yīng)用相似色調(diào)類型,文本元素的基色被分配給與主色具有最大匹配分?jǐn)?shù)的語義顏色。然后選擇調(diào)和色作為最接近主色的顏色。在雜志封面樣式的版面設(shè)計中,最顯著位置和最大允許字體大小的「刊頭」通常用于確定文本元素的基本顏色。然后將調(diào)和語義顏色設(shè)置為「刊頭」。以「刊頭」顏色為基礎(chǔ),通過主題相關(guān)調(diào)和模型和局部圖像特征對其他部分的文本進(jìn)行識別。首先,在「i」類型模板中設(shè)置文本的「色調(diào)」值。為了補償對比度與文本的本地背景,作者應(yīng)用了一個擴(kuò)展的色調(diào)模板(Tone template)。文本的色調(diào)設(shè)置為局部背景色調(diào)與飽和度在值坐標(biāo)中最遠(yuǎn)可能的相反方向之間的黃金比例點。

圖 17. 「時尚」主題中圖像的色彩設(shè)計程序說明。

3.3 實驗分析

作者在實驗中選擇了兩個對比基線方法:MM12 和 IUI13。MM12 提供了一個半自動化系統(tǒng),這樣一旦設(shè)計師為雜志設(shè)計了一種風(fēng)格,就可以基于一組內(nèi)容圖像特征自動生成文章版面[8]。IUI13 則是一個雜志封面自動設(shè)計推薦系統(tǒng)[9]。作者表示由圖 18 可以看出,本文方法的效果優(yōu)于 MM12 和 IUI13。這是由于對于每個主題,我們都提供了專門的空間布局模板和主題樣式,這有助于生成更令人愉悅的視覺文本布局。

圖 18. 與以往工作的實驗對比。(a) 和(b)分別由 MM'12 和 IUI'13 部分的重新實現(xiàn)生成。本文方法結(jié)果如(c)所示,該結(jié)果看起來自然而專業(yè),空間布局平衡,色彩和諧。(d) 由從未見過我們提出的視覺文本布局的招募而來的設(shè)計師手工設(shè)計。

此外,作者在論文中還給出了從測試參與者那里得到的反饋。作者表示,這些參與者在評論本文方法生成的排版結(jié)果時說:「令人驚訝的是,自動生成的版面看起來如此接近于設(shè)計師制作的雜志封面和真實的雜志封面。」「一些結(jié)果似乎就是設(shè)計師做的?!顾麄冋J(rèn)為我們生成的版面中文字顏色好看,整體與圖像和諧?!笗r尚主題的襯線字體看起來非常和諧。」這些參與者也給出了一些建議,例如應(yīng)該給「刊頭」更多的靈活性。此外,他們還建議,如果能夠控制每個字符的字體大小,效果可能會更好。由此,作者表示在后續(xù)工作中,會考慮將本文方法擴(kuò)展到其他類型的媒體中,如海報,以使文本元素在空間上更加靈活。

4、電路設(shè)計中的 AI

這篇文章關(guān)注的是電路設(shè)計中的 AI 問題[4]?;旌闲盘柤呻娐窡o處不在。雖然目前可以用成熟的 VLSI CAD 工具來輔助數(shù)字信號的設(shè)計,但模擬信號設(shè)計還是要依靠有經(jīng)驗的人類專家來完成。經(jīng)驗豐富的專家或者設(shè)計師可以借助學(xué)習(xí)型的自動化工具來進(jìn)行設(shè)計,但是,由于設(shè)計流程冗長復(fù)雜,即使對于他們來說,借助工具進(jìn)行設(shè)計也不是一件容易的事情。設(shè)計人員需要首先對拓?fù)浣Y(jié)構(gòu)進(jìn)行分析,并推導(dǎo)出性能指標(biāo)的計算公式。由于模擬電路具有高度非線性的特性,所以在拓?fù)浞治鲞^程中需要進(jìn)行大量的簡化和近似處理。在得到全部計算公式 / 方程的基礎(chǔ)上,計算出初始值。然后,再進(jìn)行大量的仿真、參數(shù)微調(diào),以滿足性能指標(biāo)的要求,最終輸出設(shè)計結(jié)果。由于設(shè)計空間大、仿真工具運行速度慢、不同性能指標(biāo)之間的權(quán)衡處理復(fù)雜,整個過程會非常耗費人力和時間。近年來,晶體管自動定型(Automatic transistor sizing)引起了越來越多關(guān)注。目前,主要研究內(nèi)容都集中于在單個電路上確定晶體管的尺寸。關(guān)于探索將電路設(shè)計的知識或方案從一種拓?fù)浣Y(jié)構(gòu)轉(zhuǎn)移到另一種拓?fù)浣Y(jié)構(gòu),或從一種技術(shù)節(jié)點轉(zhuǎn)移到另一種技術(shù)節(jié)點以減少設(shè)計開銷的研究則非常有限。

受強化學(xué)習(xí)(Reinforcement Learning,RL)的遷移學(xué)習(xí)能力啟發(fā),本文提出了一種能夠?qū)崿F(xiàn)知識遷移的電路設(shè)計方法(GCN-RL Circuit Designer),如圖 19 所示。首先在電路上訓(xùn)練一個 RL agent,然后應(yīng)用相同的 agent 在新的技術(shù)節(jié)點 / 拓?fù)浣Y(jié)構(gòu)上對新的電路或相同的電路進(jìn)行大小調(diào)整。這樣一來,就可以在不從頭設(shè)計的情況下降低仿真成本。

電路也可以看作是一個圖,受此啟發(fā),作者在優(yōu)化循環(huán)中利用拓?fù)鋱D,可以使優(yōu)化循環(huán)過程并不是黑盒。為了充分利用電路的拓?fù)鋱D信息,作者提出給 RL agent 配備一個圖卷積神經(jīng)網(wǎng)絡(luò) (Graph Convolutional Neural Network,GCN) 來處理電路中元件之間的連接關(guān)系。作者表示,本文是第一個利用 GCN 的 RL 在不同的技術(shù)節(jié)點和不同的拓?fù)浣Y(jié)構(gòu)之間進(jìn)行知識轉(zhuǎn)移的工作。

圖 19. 基于圖卷積神經(jīng)網(wǎng)絡(luò)的自動晶體管尺寸強化學(xué)習(xí)。

4.1 方法分析

作者將模擬電路拓?fù)浣Y(jié)構(gòu)固定的晶體管尺寸問題表述為一個邊界約束的優(yōu)化。

其中, x 為參數(shù)向量,n 為搜索的參數(shù)數(shù)目,D^n 為設(shè)計空間,優(yōu)化目標(biāo)為效益圖(Figure of Merits, FoM)。作者將 FoM 定義為歸一化性能指標(biāo)的加權(quán)總和:

其中,m_i 為測得的性能指標(biāo),(m_i)^min 和(m_i)^max 為預(yù)先定義的歸一化因子,用于對性能指標(biāo)進(jìn)行歸一化處理,以保證其滿足取值范圍要求。(m_i)^bound 是預(yù)先定義的性能上界。w_i 是調(diào)整第 i 個性能指標(biāo)重要性的權(quán)重。對于一些電路基線,存在著必須要滿足的性能規(guī)范(Performance specification,spec),如果不滿足這些規(guī)范,則給 FoM 賦負(fù)值。

完整的方法框架如圖 20 所示。在每一次迭代中,(1) 將電路拓?fù)淝度氲揭粋€圖中,圖中節(jié)點是元件,邊是導(dǎo)線;(2) 電路環(huán)境為每個晶體管生成一個狀態(tài)向量,并將帶有狀態(tài)向量的圖 (帶有圓圈節(jié)點的圖) 傳遞給 RL agent;(3) RL agent 處理圖中的每個節(jié)點,并為每個節(jié)點生成一個動作向量。然后,agent 將帶有節(jié)點動作向量的圖 (指帶有方形頂點的圖) 傳遞給電路環(huán)境;(4) 電路環(huán)境將動作規(guī)范化為參數(shù),并對其進(jìn)行細(xì)化處理;(5)模擬電路;(6)計算 FoM 值并反饋給 RL agent 更新策略。

圖 20. 方法框架圖。

本文使用 actor-critic RL agent。critic 可以被認(rèn)為是電路模擬器的一個可區(qū)分模型。agent 根據(jù)模型尋找性能最優(yōu)的點。

狀態(tài)空間(State Space)。RL agent 逐個組件處理電路圖。對于拓?fù)鋱D G 中具有 n 個元件的電路,第 k 個元件的狀態(tài) s_k 定義為:s_k=(k, t, h),其中 k 是晶體管指數(shù)的 one-hot 表示,t 是元件類型的 one-hot 表示,h 是元件的選定模型特征向量,它進(jìn)一步區(qū)分不同的元件類型。對于 NMOS 和 PMOS,使用的模型參數(shù)是 V_sat, V_th0, V_fb, μ_0 和 U_c。對于電容和電阻,將模型參數(shù)設(shè)置為 0。例如,對于一個有四個不同種類(NMOS、PMOS、R、C)的十個元件和一個五維模型特征向量的電路,第三個元件(一個 NMOS 晶體管)的狀態(tài)向量為:

對于觀測向量 s_k 中的每一個維度,我們通過不同分量的平均值和標(biāo)準(zhǔn)差對它們進(jìn)行歸一化處理。

動作空間(Action Space)。由于搜索所需的參數(shù)不一樣,所以不同類型的組件的動作向量也不一樣。對于第 k 個元件,如果是 NMOS 或 PMOS 晶體管,其動作矢量擬定為(a_k)^MOS =(W, L, M),其中 W 和 L 為晶體管柵極的寬度和長度,M 為復(fù)用器。對于電阻器,其動作矢量公式為:(a_k)^R = (r)。其中,r 為電阻值。對于電容器,其動作矢量公式為:(a_k)^C = (c)。其中,c 為電容值。作者使用一個連續(xù)的動作空間來確定晶體管的尺寸,這是由于使用離散動作空間會失去相對順序信息同時離散空間過大。

獎勵(Reward)。獎勵是 FoM。它是歸一化性能指標(biāo)的加權(quán)和。在默認(rèn)設(shè)置中,所有的指標(biāo)都是同等權(quán)重的。

為了將圖鄰接信息嵌入到優(yōu)化循環(huán)中,作者利用 GCN 來處理 RL agent 中的拓?fù)鋱D。如圖 21 所示,一個 GCN 層通過聚合來自其鄰居節(jié)點的特征向量來計算每個晶體管的隱藏表示。如果堆疊多個 GCN 層,一個節(jié)點就可以接收到距離很遠(yuǎn)的節(jié)點的信息。在本文框架中,作者應(yīng)用了 7 個 GCN 層,以確保最后一層在整個拓?fù)鋱D上有一個全局接受場。

GCN 層可以表述為:

拓?fù)鋱D G 的鄰接矩陣(A)加單位矩陣(I_N)

一個特定層的可訓(xùn)練權(quán)重矩陣,與圖 21 中共享權(quán)重相呼應(yīng)

圖 21. 多層 GCN 的強化學(xué)習(xí) agent。

actor 和 critic 模型的架構(gòu)略有不同(圖 21)。actor 的第一層是所有組件共享的 FC 層。critic 的第一層是一個共享的 FC 層,有一個特定組件的編碼器來編碼不同的動作。actor 的最后一層有一個組件特定的解碼器來解碼不同動作的隱藏激活,而 critic 有一個共享的 FC 層來計算預(yù)測的獎勵值。作者設(shè)計這些特定的編碼器 / 解碼器層是因為不同的組件有不同類型的動作(參數(shù))。actor 最后一層的輸出是每個組件的預(yù)設(shè)參數(shù)向量,范圍為[-1, 1]。作者對它們進(jìn)行去歸一化和細(xì)化處理,以得到最終的參數(shù)。

關(guān)于技術(shù)節(jié)點間的遷移問題,如圖 22 所示,專家或設(shè)計工程師首先從一個節(jié)點中繼承拓?fù)浣Y(jié)構(gòu)并計算初始參數(shù),然后反復(fù)調(diào)整參數(shù)、仿真并分析性能。本文方法可以將這一過程自動化,在一個技術(shù)節(jié)點上訓(xùn)練一個 RL agent,然后憑借不同技術(shù)節(jié)點之間相似的設(shè)計原理,直接應(yīng)用訓(xùn)練好的 agent 去搜索不同技術(shù)節(jié)點下的同一電路。

關(guān)于拓?fù)溟g的遷移問題。如果不同的拓?fù)浣Y(jié)構(gòu)具有相似的設(shè)計原理,也可以在不同的拓?fù)浣Y(jié)構(gòu)之間進(jìn)行知識轉(zhuǎn)移,比如兩級跨阻放大器和三級跨阻放大器之間。修改 GCN 中的狀態(tài)向量,將 k 修改為一維索引值(one-dimension index value),而不是 one-hot 索引向量(one-hot index vector)。這樣一來,在不同的拓?fù)浣Y(jié)構(gòu)中,每個分量的狀態(tài)向量的維度保持不變。

圖 22. 知識遷移。

4.2 實驗分析

作者通過實驗證明了本文方法實現(xiàn) Three-TIA 上技術(shù)節(jié)點之間的知識遷移。作者將在 180nm 上學(xué)到的設(shè)計遷移到 45nm、65nm、130nm 和 250nm 上,學(xué)習(xí)曲線見圖 23。agent 在 180nm 上進(jìn)行訓(xùn)練,并遷移到較大的節(jié)點 250nm 和較小的節(jié)點 130nm、65nm 和 45nm 中,以驗證其廣泛的有效性。經(jīng)過 100 個熱身步驟后,有知識遷移的 FoM 迅速增加,最后收斂在比沒有知識遷移更高的水平。

為了驗證將所學(xué)的知識從一種拓?fù)浣Y(jié)構(gòu)遷移到另一種拓?fù)浣Y(jié)構(gòu)的能力,作者選擇了 Two-TIA 和 Three-TIA,因為它們都是跨阻抗放大器,因此有一些共同的知識,學(xué)習(xí)曲線見圖 24。GCN-RL 一直比 NG-RL(即 non-GCN RL,未使用 GCN 的 RL)得到了更高的 FoM。在沒有 GCN 的情況下,NG-RL 的 FoM 與沒有遷移的方法勉強處于同一水平,這說明使用 GCN 從圖中提取知識是至關(guān)重要的,GCN 提取的圖信息有助于提高知識遷移性能。

圖 23. Three-TIA 上技術(shù)節(jié)點之間的知識遷移。將在 180nm 上學(xué)到的設(shè)計轉(zhuǎn)移到 45nm、65nm、130nm 和 250nm 上。

圖 24. Two-TIA 和 Three-TIA 之間的知識遷移。

5、文章小結(jié)

設(shè)計是一種有目標(biāo)有計劃的進(jìn)行技術(shù)性的創(chuàng)作與創(chuàng)意活動,所以設(shè)計是一種與人類抽象思維能力高度相關(guān)的任務(wù),在設(shè)計中引入人工智能就更具挑戰(zhàn)。

我們在這篇文章中具體探討了人工智能在結(jié)構(gòu)設(shè)計、產(chǎn)品設(shè)計、電路設(shè)計、排版版面設(shè)計中的應(yīng)用。其中,結(jié)構(gòu)設(shè)計和電路設(shè)計中的應(yīng)用方法較為相似,都是將設(shè)計問題轉(zhuǎn)化為數(shù)學(xué)問題,然后對數(shù)學(xué)中的離散或連續(xù)變量進(jìn)行建模并分析。排版版面設(shè)計任務(wù)與文本識別、圖像合成高度相關(guān),主要是通過套用模板、設(shè)計色彩實現(xiàn)排版。產(chǎn)品設(shè)計則是指應(yīng)用心理測量學(xué)來理解用戶的設(shè)計感知,為后續(xù)的設(shè)計周期生成反饋,并逐步更新機器學(xué)習(xí)模型以適應(yīng)在線應(yīng)用中用戶偏好的快速變化的設(shè)計過程。

在設(shè)計中引入人工智能,能夠利用人工智能的記憶能力、學(xué)習(xí)能力、計算能力不斷地探索并找到最佳的設(shè)計方案。如何更合理地對設(shè)計問題進(jìn)行建模和分析,如何根據(jù)不同設(shè)計問題的特點找到最適合的 AI 方法,還有待更深入的研究和探討。

【本文參考引用的文獻(xiàn)】

[1] Chaeibakhsh S , Novin R S , Hermans T , et al. Optimizing Hospital Room Layout to Reduce the Risk of Patient Falls, 2021. https://arxiv.org/pdf/2101.03210.pdf.

[2] Chaehan So. Human-in-the-Loop Design Cycles – A Process Framework that Integrates Design Sprints, Agile Processes, and Machine Learning with Humans. The first International Conference on Artificial Intelligence in HCI 2020. https://arxiv.org/ftp/arxiv/papers/2003/2003.05268.pdf.

[3] Wang Hanrui, Yang Jiacheng, et al. Learning to Design Circuits NIPS‘18 .https://arxiv.org/pdf/1812.02734.pdf.

[4] Wang, Hanrui, Wang, Kuan, et al. GCN-RL Circuit Designer: Transferable Transistor Sizing with Graph Neural Networks and Reinforcement Learning. The 57th Design Automation Conference (DAC) 2020. https://hanlab.mit.edu/projects/gcnrl/

[5] Yang Xuyong, Mei Tao. Automatic Generation of Visual-Textual Presentation Layout. ACM Transactions on Multimedia Computing, Communications, and Applications, Volume 12, Issue 2. https://dl.acm.org/doi/10.1145/2818709.

[6] Novin, R. S., Taylor, E., Hermans, T., and Merryweather, A. (2020). Development of a novel computational model

for evaluating fall risk in patient room design. HERD: Health Environments Research & Design Journal.

[7] EO: IDEO Human-Centered Design Toolkit. 2nd Edition, (2008). https://doi.org/10.1002/ejoc.201200111.

[8] Mikko Kuhna, Ida-Maria Kivel¨ a, and Pirkko Oittinen. 2012. Semi-automated Magazine Layout Using Content-based Image Features. In Proceedings of the 20th ACM international conference on Multimedia (MM’12). ACM, ACM, New York, NY, USA, 379–388.

[9] Ali Jahanian, Jerry Liu, Qian Lin, Daniel Tretter, Eamonn O’Brien-Strain, Seungyon Claire Lee, Nic Lyons, and Jan Allebach. 2013. Recommendation System for Automatic Design of Magazine Covers. In Proceedings of International Conference on Intelligent User Interfaces. ACM, 95–106.

分析師介紹:

本文作者為仵冀穎,工學(xué)博士,畢業(yè)于北京交通大學(xué),曾分別于香港中文大學(xué)和香港科技大學(xué)擔(dān)任助理研究員和研究助理,現(xiàn)從事電子政務(wù)領(lǐng)域信息化新技術(shù)研究工作。主要研究方向為模式識別、計算機視覺,愛好科研,希望能保持學(xué)習(xí)、不斷進(jìn)步。

熱門課程推薦

熱門資訊

請綁定手機號

x

同學(xué)您好!

您已成功報名0元試學(xué)活動,老師會在第一時間與您取得聯(lián)系,請保持電話暢通!
確定