北京前瞻人工智能安全與治理研究院是聚焦人工智能安全發(fā)展與治理,融合科學(xué)研究、產(chǎn)業(yè)應(yīng)用、高端智庫能力的北京市新型研發(fā)與產(chǎn)業(yè)賦能機(jī)構(gòu)。研究院致力于構(gòu)建系統(tǒng)化的AI安全與治理體系,服務(wù)人工智能的創(chuàng)新與應(yīng)用,推動(dòng)前沿人工智能技術(shù)的安全與穩(wěn)健發(fā)展。依托北京市豐富的學(xué)術(shù)資源與產(chǎn)業(yè)生態(tài),研究院積極推進(jìn)跨學(xué)科融合與應(yīng)用發(fā)展,面向重大安全問題與前瞻議題持續(xù)攻堅(jiān),探索可持續(xù)的人工智能發(fā)展與治理路徑。
研究院由聯(lián)合國人工智能高級顧問機(jī)構(gòu)(UN AI Advisory Body)專家、TIME100/AI入選者曾毅領(lǐng)銜發(fā)起并任院長,聚焦人工智能模型安全、治理機(jī)制與實(shí)踐、倫理評估體系建設(shè)等關(guān)鍵方向。研究院核心成果發(fā)表在AAAI、ICML等領(lǐng)域頂級國際會(huì)議,作為中國人工智能安全與治理代表性機(jī)構(gòu)之一參與國際合作與科技外交。核心研究團(tuán)隊(duì)成員來自中國科學(xué)院、哈爾濱工業(yè)大學(xué)、愛丁堡大學(xué)等知名科研機(jī)構(gòu),并與北京大學(xué)、清華大學(xué)、中國信通院、中科聞歌、瑞萊智慧等產(chǎn)研機(jī)構(gòu)相關(guān)科研與產(chǎn)業(yè)化機(jī)構(gòu)與團(tuán)隊(duì)深度合作。
研究院的核心價(jià)值觀:人工智能倫理安全是人工智能的研發(fā)、應(yīng)用與部署的第一性原理,不可刪除,不可違背。安全與治理不僅是駕馭技術(shù)發(fā)展的韁繩,更是引領(lǐng)其正確航向的方向盤。安全與治理能力是人工智能的能力發(fā)展的核心要素。技術(shù)創(chuàng)新與風(fēng)險(xiǎn)防范可以也必須兼得。安全與治理確保人工智能穩(wěn)健發(fā)展,賦能全球可持續(xù)發(fā)展與和諧共生。
研究院網(wǎng)站:https://www.beijing-aisi.ac.cn
根據(jù)近期科研與產(chǎn)業(yè)賦能工作需求,現(xiàn)招聘以下崗位,工作地點(diǎn)為中關(guān)村門頭溝園京西智谷:
一、 崗位名稱:
崗位職責(zé):
1.開展大語言模型(LLM)相關(guān)的安全性研究,探索模型對齊、魯棒性、偏見防控、紅隊(duì)測試等關(guān)鍵問題;
2.研究并開發(fā)基于強(qiáng)化學(xué)習(xí)等方法的人類偏好對齊與安全增強(qiáng)算法;
3.參與開源LLM框架或安全評估工具的研發(fā)與維護(hù),推動(dòng)安全技術(shù)在大模型體系中的落地;
4.撰寫與發(fā)表高水平國內(nèi)外頂會(huì)/期刊研究論文;
5.跟蹤與研判前沿進(jìn)展,協(xié)助團(tuán)隊(duì)制定研究方向與技術(shù)路線,推動(dòng)產(chǎn)學(xué)研協(xié)同發(fā)展。
任職要求:
1.計(jì)算機(jī)、人工智能、數(shù)學(xué)、控制等相關(guān)專業(yè)博士,或碩士具備高水平研究成果;
2.熟悉主流大語言模型訓(xùn)練和推理架構(gòu)(Transformers,veRL,TRL,vllm,SGLang等),具備大模型微調(diào)與對齊經(jīng)驗(yàn);
3.扎實(shí)的強(qiáng)化學(xué)習(xí)背景,尤其在RLHF、RLAIF、GRPO等方面有實(shí)踐或理論成果;
4.至少在A類國際會(huì)議/期刊發(fā)表過2篇以上相關(guān)論文(NeurIPS、ICLR、ICML、ACL等);
5.有LLM安全方向研究經(jīng)驗(yàn)者優(yōu)先,如有紅隊(duì)測試、可解釋性、審查機(jī)制等項(xiàng)目經(jīng)驗(yàn)尤佳;
6.具備良好的科研能力、獨(dú)立思考與團(tuán)隊(duì)協(xié)作精神,善于溝通與知識(shí)共享。
我們提供:
有競爭力的薪酬待遇與科研資源支持;
與一流高校、實(shí)驗(yàn)室和產(chǎn)業(yè)合作的科研環(huán)境;
支持產(chǎn)出高水平論文并參與國內(nèi)外交流;
專注于前沿領(lǐng)域的探索機(jī)會(huì)與成長空間。
二、 崗位名稱:
LLM安全方向?qū)嵙?xí)生
崗位職責(zé):
1.協(xié)助開展大語言模型(LLM)相關(guān)的安全性研究與系統(tǒng)實(shí)驗(yàn),包括模型對齊、風(fēng)險(xiǎn)評估、魯棒性測試等;
2.支持價(jià)值對齊相關(guān)項(xiàng)目的算法調(diào)研與原型實(shí)現(xiàn);
3.跟進(jìn)國內(nèi)外相關(guān)領(lǐng)域最新研究進(jìn)展,參與論文閱讀、報(bào)告撰寫及代碼實(shí)現(xiàn);
4.協(xié)助研究團(tuán)隊(duì)進(jìn)行數(shù)據(jù)處理、模型訓(xùn)練與實(shí)驗(yàn)評估。
任職要求:
1.計(jì)算機(jī)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)碩士或本科高年級在讀,具備扎實(shí)的編程能力(如Python、PyTorch);
2.對大語言模型和/或強(qiáng)化學(xué)習(xí)有深入興趣,有相關(guān)項(xiàng)目、論文或開源貢獻(xiàn)者優(yōu)先;
3.具備良好的英文文獻(xiàn)閱讀能力和科研寫作能力;
4.每周可實(shí)習(xí)至少3天,實(shí)習(xí)期不少于3個(gè)月(優(yōu)秀者可遠(yuǎn)程,定期線下參會(huì)研討);
5.有志于在人工智能前沿研究領(lǐng)域深入發(fā)展。
我們提供:
與優(yōu)秀研究員共同參與前沿科研項(xiàng)目的機(jī)會(huì);
實(shí)習(xí)期間有導(dǎo)師指導(dǎo),表現(xiàn)優(yōu)異者有留用/推薦信/合著論文等機(jī)會(huì);
豐富的學(xué)術(shù)資源與實(shí)驗(yàn)平臺(tái)支持,開放包容的團(tuán)隊(duì)氛圍。
三、 應(yīng)聘方式
請將以下材料發(fā)送至(點(diǎn)擊查看),請【點(diǎn)擊下方“立即投遞/投遞簡歷”,即刻進(jìn)行職位報(bào)名】:
簡歷
代表論文PDF(標(biāo)注頂會(huì)收錄情況)
GitHub技術(shù)賬號(附安全相關(guān)項(xiàng)目鏈接)
研究陳述(500字闡明對LLM安全趨勢的理解)
北京前瞻人工智能安全與治理研究院(Beijing Institute of AI Safety and Governance)是通過人工智能安全發(fā)展與治理,促進(jìn)人工智能穩(wěn)健發(fā)展與負(fù)責(zé)任應(yīng)用的新型研發(fā)機(jī)構(gòu)。前瞻研究院致力于構(gòu)建系統(tǒng)化的安全與治理體系,為人工智能的創(chuàng)新和應(yīng)用提供堅(jiān)實(shí)的安全保障,引領(lǐng)人工智能安全與治理的新趨勢。前瞻研究院致力于打通人工智能安全與治理前沿研究及產(chǎn)業(yè)自律自治、政府引導(dǎo)與監(jiān)管的全新探索。研究院基于北京市和國內(nèi)外合作伙伴的豐富學(xué)術(shù)資源和產(chǎn)業(yè)優(yōu)勢,推動(dòng)跨學(xué)科合作,不斷探索新的研究路徑,解決人工智能倫理與安全領(lǐng)域中的潛在和緊迫問題。研究院還致力于人工智能長遠(yuǎn)風(fēng)險(xiǎn)與安全的戰(zhàn)略性前瞻研究,并積極參與和貢獻(xiàn)于人工智能安全與治理國家戰(zhàn)略和國際合作與交流。前瞻研究院不僅僅是立足北京,服務(wù)北京,更會(huì)將北京人工智能安全與治理的探索與全國各省市積極分享,共同探討與促進(jìn)。并與全國的相關(guān)機(jī)構(gòu)一道促進(jìn)人工智能安全與治理的中國實(shí)踐,發(fā)出中國聲音,融入和貢獻(xiàn)于全球人工智能的穩(wěn)健發(fā)展。
研究院網(wǎng)址:http://beijing-aisi.ac.cn/
聯(lián)系方式:contact@beijing-aisi.ac.cn
信息來源于網(wǎng)絡(luò),如有變更請以原發(fā)布者為準(zhǔn)。
來源鏈接:
https://mp.weixin.qq.com/s/Yuoq_eOyhLFa3pM3fWWhWQ