南京大學(xué)自然語言處理研究組2024年NLP夏令營招募公告

發(fā)布時(shí)間:2024-06-13 編輯:保研喵

添加南京大學(xué)學(xué)姐微信,或微信搜索公眾號(hào)“越考保研”,關(guān)注[越考保研]微信公眾號(hào),在越考保研微信號(hào)輸入[南京大學(xué)保研夏令營條件、南京大學(xué)保研加分細(xì)則、南京大學(xué)保研群、南京大學(xué)保研學(xué)姐微信、南京大學(xué)保研真題、南京大學(xué)夏令營2023]即可在手機(jī)上查看相對應(yīng)南京大學(xué)保研信息和免費(fèi)資源
回復(fù)[夏令營信息][保研去向][保研來源][入營名單]即可查看蕞新蕞全的保研數(shù)據(jù)。

南京大學(xué)自然語言處理研究組2024年NLP夏令營招募公告內(nèi)容如下,更多考研資訊請關(guān)注我們網(wǎng)站的更新!敬請收藏本站,或下載我們的考研派APP和考研派微信公眾號(hào)。

南京大學(xué)自然語言處理研究組2024年NLP夏令營招募公告 正文

注意:該夏令營與計(jì)算機(jī)系以及人工智能學(xué)院的推免夏令營無關(guān)。
南京大學(xué)自然語言處理研究組(NJUNLP)是國內(nèi)最早從事NLP領(lǐng)域科研工作的團(tuán)隊(duì)之一,先后承擔(dān)國家科技攻關(guān)項(xiàng)目、863項(xiàng)目、國家自然科學(xué)基金、江蘇省自然科學(xué)基金等20項(xiàng),獲國家七五科技攻關(guān)重大成果獎(jiǎng)1次、教育部科技進(jìn)步獎(jiǎng)2次、江蘇省科技進(jìn)步二等獎(jiǎng)、三等獎(jiǎng)各一次;近3年在自然語言處理和人工智能頂級(jí)會(huì)議上(ACL、AAAI、IJCAI、EMNLP等)發(fā)表論文四十余篇,累計(jì)發(fā)表論文200+篇;多次參與自然語言處理相關(guān)的比賽和評(píng)測,并獲得第一(WMT2023-QE、WMT2022-QE(機(jī)器翻譯質(zhì)量自動(dòng)評(píng)估)評(píng)測英德語言方向多個(gè)任務(wù)、CCF-BDCI2018情感分析、NLPCC2012分詞、SIGHAN2006命名實(shí)體識(shí)別)。
研究組開展的本科生NLPSummerCamp活動(dòng)旨在為本科生提供了解自然語言處理及運(yùn)用自然語言處理技術(shù)解決實(shí)際問題的平臺(tái)。今年該活動(dòng)受到江蘇省計(jì)算機(jī)學(xué)會(huì)—2024年江蘇省研究生”計(jì)算機(jī)科學(xué)之美:從理論計(jì)算到大語言模型”暑期學(xué)校項(xiàng)目支持。該活動(dòng)設(shè)置若干自然語言處理領(lǐng)域的前沿課題,每個(gè)課題由本組優(yōu)秀博士生擔(dān)任組長。在報(bào)名開始時(shí),同學(xué)們可以自愿選擇感興趣的課題。在報(bào)名結(jié)束后,研究組將根據(jù)課題方向組織面試選拔,通過選拔的同學(xué)可以正式參與夏令營活動(dòng)。完成課程和相應(yīng)課題的同學(xué)在活動(dòng)結(jié)束后將獲得南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系印發(fā)的結(jié)題證書,后期申請保研至NLP研究組時(shí)會(huì)被優(yōu)先考慮,入學(xué)后憑該證書有機(jī)會(huì)兌換相應(yīng)研究生課程學(xué)分。
一、項(xiàng)目計(jì)劃
舉辦形式:本次夏令營采用線上與線下相結(jié)合的模式,南京大學(xué)本校生線下參與,外校學(xué)生線上參與。
項(xiàng)目周期:7月1日-8月11日,為期6周,前1周集中培訓(xùn),后5周自主學(xué)習(xí),并跟隨組長進(jìn)行項(xiàng)目實(shí)戰(zhàn)。
項(xiàng)目內(nèi)容:共有6個(gè)課題,后期設(shè)有通識(shí)講座、基礎(chǔ)課程以及學(xué)術(shù)論壇。
招募人數(shù):計(jì)劃每個(gè)課題招募3-5名學(xué)員。
二、項(xiàng)目要求
申請對象:原則上僅限大三及以下的在校本科生報(bào)名,優(yōu)先考慮具有自然語言處理或機(jī)器學(xué)習(xí)基礎(chǔ)知識(shí)的大一、大二在校本科生。
時(shí)間安排:本次夏令營是為期六周的全程跟進(jìn)學(xué)習(xí),請有意參加夏令營的同學(xué)提前安排好時(shí)間,避免出現(xiàn)安排沖撞、時(shí)間精力不足以及中途退出等情況。
三、申請流程
網(wǎng)上申請
即日起,可登錄:https://wj.qq.com/s2/14712744/8fio/,填寫報(bào)名信息,申請截止時(shí)間為:6月18日23:59。
資格初審
申請截止后,工作小組對申請者提供的報(bào)名信息進(jìn)行資格初審,面試名單,預(yù)計(jì)在6月20日以公眾號(hào)以及郵箱形式發(fā)布。面試時(shí)間初定于:6月22日-6月24日。
結(jié)果發(fā)布
面試結(jié)束后,工作小組結(jié)合學(xué)員信息以及面試情況,確定夏令營入圍名單,預(yù)計(jì)在6月26日公布。
以上項(xiàng)目流程公布日期均為擬定,具體時(shí)間以后續(xù)通知為準(zhǔn),請對夏令營感興趣的同學(xué)按照初步擬定的日期安排規(guī)劃好自己的時(shí)間,并在此期間及時(shí)關(guān)注自己的郵箱以及我們的公眾號(hào),避免出現(xiàn)錯(cuò)過通知的情況。
四、課題名稱
課題1:上下文學(xué)習(xí)增強(qiáng)的生物分子大語言模型研究
隨著大語言模型(LLM)和AI4Science的蓬勃發(fā)展,越來越多的工作開始關(guān)注生物分子與自然語言的聯(lián)合建模,大量生物分子LLM被提出。這些方法利用豐富的生物化學(xué)科學(xué)文獻(xiàn)、數(shù)據(jù)庫數(shù)據(jù)對LLM后訓(xùn)練,增強(qiáng)了LLM對生物分子數(shù)據(jù)的理解,提高了其分子描述、分子-文本跨模態(tài)檢索的能力。但面對分子屬性預(yù)測這一更具實(shí)際意義的任務(wù)時(shí),現(xiàn)有生物分子LLM表現(xiàn)欠佳。我們擬基于上下文學(xué)習(xí),設(shè)計(jì)合適的示例選擇、模板設(shè)計(jì)策略,提高生物分子LLM的屬性預(yù)測能力。
課題2:大型多模態(tài)模型知識(shí)學(xué)習(xí)能力探究
大型多模態(tài)模型(LargeMultimodalModel,LMM)被認(rèn)為是通向通用人工智能AGI的關(guān)鍵之一,近期受到了研究者們廣泛的關(guān)注。目前LMM在視覺感知、推理、世界知識(shí)等任務(wù)上有著出色的表現(xiàn)。對于人類而言,除了這些已經(jīng)掌握的能力外,人們在日常生活中會(huì)不斷學(xué)習(xí)新的知識(shí),并在之后的決策中利用它。例如記住認(rèn)識(shí)的新朋友的名字或某種奶茶的味道。本課題計(jì)劃探索當(dāng)前最先進(jìn)的開源和閉源LMM學(xué)習(xí)此類新知識(shí)的能力,并研究不同學(xué)習(xí)方法(例如情景學(xué)習(xí)和參數(shù)微調(diào))對模型知識(shí)學(xué)習(xí)的影響。
課題3:大語言模型的結(jié)構(gòu)化文本生成
大語言模型(LLMs)在語言理解和生成方面展示了非凡的能力,它不僅能生成富有創(chuàng)造性和多樣性的回復(fù),還能高度適應(yīng)各種用戶需求。盡管LLM無拘無束的創(chuàng)造力在對話場景中十分重要,然而,當(dāng)把它們集成到LLM驅(qū)動(dòng)的應(yīng)用開發(fā)中時(shí),必須限制它們的輸出遵循特定的格式或標(biāo)準(zhǔn)。例如,用戶可能會(huì)要求文章摘要"嚴(yán)格少于20個(gè)字"以滿足長度限制,或者要求LLM返回能被解析的有效JSON,以滿足開發(fā)流水線的要求。
然而,即使在提示中明確定義了約束條件,目前最先進(jìn)的LLM仍然無法保證生成的輸出始終符合用戶的要求。雖然研究人員提出了各種方法來提高可控性,如利用專門數(shù)據(jù)集進(jìn)行有監(jiān)督的微調(diào),但這些方法往往只關(guān)注解決范圍較窄的約束,并且受到數(shù)據(jù)和訓(xùn)練成本的限制。針對以上問題,本課題重點(diǎn)關(guān)注LLM受控解碼策略,帶領(lǐng)營員探索基于有限狀態(tài)機(jī)的正則表達(dá)式約束生成以及基于下推自動(dòng)機(jī)的json約束生成,同時(shí)對不同字段引入細(xì)粒度約束,并評(píng)估方法的約束能力以及對LLM性能的潛在影響。
課題4:翻譯評(píng)估視角的大語言模型可解釋性分析
大語言模型(LLM)在多類任務(wù)上都展現(xiàn)出了不俗的表現(xiàn),然而,這些模型的復(fù)雜性和黑箱特性使得理解其內(nèi)部工作機(jī)制變得困難。本課題將從翻譯評(píng)估任務(wù)的角度,分析大語言模型的翻譯評(píng)估過程和結(jié)果,探討其可解釋性。在大語言模型中,不同的注意力頭可能具有不同的功能。通過深入研究模型在不同語言對和翻譯評(píng)估任務(wù)中的表現(xiàn),我們希望能夠識(shí)別出語言和任務(wù)相關(guān)的神經(jīng)回路,為模型在處理翻譯評(píng)估任務(wù)時(shí)的行為給出較為可靠的解釋。進(jìn)一步,探討如何根據(jù)解釋的結(jié)果來改進(jìn)模型在此任務(wù)上的表現(xiàn)。
課題5:大語言模型數(shù)學(xué)推理能力探究
目前大語言模型(LLMs)在諸多任務(wù)上展現(xiàn)了強(qiáng)大的能力,然而,即使是最強(qiáng)大的模型(如GPT4),復(fù)雜數(shù)學(xué)推理能力仍有待加強(qiáng)。為此,研究人員通過思維鏈技術(shù)(CoT)激發(fā)現(xiàn)有大模型的推理能力,并通過設(shè)計(jì)訓(xùn)練流程和驗(yàn)證策略以進(jìn)一步提升模型的數(shù)學(xué)能力。本次夏令營中,課題組將帶領(lǐng)營員回顧近年來基于大模型的數(shù)學(xué)解題技術(shù),并復(fù)現(xiàn)數(shù)學(xué)解題模型訓(xùn)練流程,試圖探索模型在數(shù)學(xué)推理上的能力邊界并嘗試進(jìn)行改進(jìn)。
課題6:大語言模型情緒激發(fā)能力探究
AI技術(shù)的發(fā)展遠(yuǎn)超我們的想象,在以ChatGPT為代表的LLM誕生以來,互聯(lián)網(wǎng)中越來越多的AI在未經(jīng)研究的情況下被直接應(yīng)用了。舉例來說,b站已經(jīng)出現(xiàn)了不少AIVtuber/AI主導(dǎo)的up。他們都在某種程度上為人們提供情緒價(jià)值/情緒輸出。正向的情緒價(jià)值自然是有意義的,但是,其中也會(huì)蘊(yùn)含著很多風(fēng)險(xiǎn)-AI對人是不是也會(huì)產(chǎn)生負(fù)面的情緒影響?盡管傳統(tǒng)對話系統(tǒng)已經(jīng)研究了如何生成empathy、安全的內(nèi)容,但AI對于人類情緒的激發(fā)能力一直沒被充分探索。類人表達(dá)能力的大幅提升或許可以帶來更多的可能性,特別是在心理疏導(dǎo)、診療等領(lǐng)域。因此,本課題將探索AI激發(fā)人類情緒的能力,具體來說,我們可能會(huì)探索以下問題:
機(jī)器可不可以激發(fā)人的指定情緒?這種激發(fā)能力有什么特點(diǎn)?
如果可以,可不可以通過一些設(shè)計(jì)來強(qiáng)化這種激發(fā)能力?
如有任何疑問,請聯(lián)系郵箱:liul@smail.nju.edu.cn。

南京大學(xué)相關(guān)保研資源下載:

南京大學(xué)歷年保研筆試/面試真題匯編.pdf
南京大學(xué)保研夏令營信息匯總表.xls
南京大學(xué)預(yù)推免信息匯總表.xls
南京大學(xué)保研生源分析表.xls
南京大學(xué)本科生保研去向分析表.xls
各重點(diǎn)院校保研夏令營信息匯總表(報(bào)名截止時(shí)間).zip
各重點(diǎn)院校推免生條件及要求匯總表.zip

南京大學(xué)

添加南京大學(xué)學(xué)姐微信,或微信搜索公眾號(hào)“越考保研”,關(guān)注【越考保研】微信公眾號(hào),在越考保研公眾號(hào)輸入【南京大學(xué)保研夏令營條件、南京大學(xué)保研加分細(xì)則、南京大學(xué)保研群、南京大學(xué)保研學(xué)姐微信、南京大學(xué)保研真題、南京大學(xué)夏令營】即可在手機(jī)上查看相對應(yīng)南京大學(xué)保研信息和免費(fèi)資源。
回復(fù)【夏令營信息】【保研去向】【保研來源】【入營名單】即可查看蕞新蕞全的保研數(shù)據(jù)。
南京大學(xué)保研


本文來源:http://www.zhongzhouzhikong.com/nanjingdaxue/byxly_904611.html

推薦閱讀