久久99热66热这里只有精品,特黄特色的大片在线观看,亚洲日本三级在线观看,国产三级农村妇女在线,亚洲av毛片免费在线观看,哺乳叫自慰在线看,天天干美女av网

百度軟件研發(fā)工程師筆試題

時(shí)間:2024-06-11 09:48:49 資料大全 我要投稿
  • 相關(guān)推薦

百度軟件研發(fā)工程師筆試題

一,簡答題(本題共30分)
  1. 當(dāng)前計(jì)算機(jī)系統(tǒng)一般會采用層次結(jié)構(gòu)來存儲數(shù)據(jù),請介紹下典型的計(jì)算機(jī)存儲系統(tǒng)一般分為哪幾個(gè)層次,為什么采用分層存儲數(shù)據(jù)能有效提高程序的執(zhí)行效率?(10分)
  2. Unix/Linux系統(tǒng)的僵尸進(jìn)程是如何產(chǎn)生的?有什么危害?如何避免?(10)
  3. 簡述Unix/Linux系統(tǒng)中使用socket庫編寫服務(wù)器程序的流程,請分別用對應(yīng)的socket通信函數(shù)表示,

百度軟件研發(fā)工程師筆試題


  二,算法與程序設(shè)計(jì)題(本題共45分)
  1, 使用C/C++語言寫一個(gè)函數(shù),實(shí)現(xiàn)字符串的反轉(zhuǎn),要求不能用任何系統(tǒng)函數(shù),且時(shí)間復(fù)雜度最小。函數(shù)原型是:char *reverse_str(char *str)(15分)
  2, 給定一個(gè)如下輸入格式的字符串,(1,(2,3),(4,(5,6),7))括號內(nèi)的元素可以是數(shù)字,也可以另一個(gè)括號,請實(shí)現(xiàn)一個(gè)算法消除嵌套的括號。比如把上面的表達(dá)式變成:(1,2,3,4,5,6,7),如果表達(dá)式有誤請報(bào)錯。(15分)
  3, 相似度計(jì)算用于衡量對象之間的相似程度,在數(shù)據(jù)挖據(jù),自然語言處理中使一個(gè)基礎(chǔ)性
計(jì)算,在廣告檢索服務(wù)中往往也會判斷網(wǎng)民檢索Query和廣告Adword的主題相似度。假設(shè)Query或者Adword的主題屬性定義為一個(gè)長度為10000的浮點(diǎn)數(shù)據(jù)Pr[10000](稱之為主題概率數(shù)組),其中Pr[i]表示Query或者Adword屬于主題Id為i的概率,而Query和Adword的相似度簡化定義為兩者主題概率數(shù)組的內(nèi)積,即sim(Query,Adword)=sum(QueryPr[i]*AdwordPr[i])(0<==i<10000).在實(shí)際應(yīng)用場景中,由于大多數(shù)主題的概率都為0,所以主題概率數(shù)組往往比較稀疏,在實(shí)現(xiàn)時(shí)會以一個(gè)緊湊型數(shù)組topic_info_t[]的方式保存,其中100<=數(shù)組大小<=1000,并按照  topic_id遞增排列,0<=topic_id<10000,0 ,0<topic_pr<1.
  Struct topic_info_t{
  Int topic_id;
  Float topic_pr;
  }
  現(xiàn)在給出Query的topic_info_t數(shù)組和N(N>=5000)個(gè)Adwords的 topic_info-t數(shù)組,現(xiàn)要求出Query與Adwords的相似度最大值,即max(sim(Query,Adword[i])(0<=i<N).
  Float max_sim(const vector& query_topic_info,
  Const vector adwords_topic_info[],
  Int adwords_number);
  編寫代碼求時(shí)間復(fù)雜度最低的算法,并給出時(shí)間復(fù)雜度分析,

資料共享平臺

百度軟件研發(fā)工程師筆試題》(http://m.dameics.com)。(15分)
  三,系統(tǒng)設(shè)計(jì)題(本題共25分)
  在企業(yè)中,對生產(chǎn)數(shù)據(jù)進(jìn)行分析具有很重要的意義。但是生產(chǎn)數(shù)據(jù)通常不能直接用于數(shù)據(jù)分析,通常需要進(jìn)行抽取,轉(zhuǎn)換和加載,也就是業(yè)界常識的ETL.
  生產(chǎn)數(shù)據(jù)

  為了便于開發(fā)和維護(hù),并提高數(shù)據(jù)實(shí)時(shí)性,通常將一個(gè)完整的ETL過程分析哼多個(gè)任務(wù),組成流水線,如下圖所示:

  假設(shè)任務(wù)定義和任務(wù)之間的依賴關(guān)系都保存在文件中,文件格式分別如下:
  表格1任務(wù)元數(shù)據(jù)
文件 格式 例子 任務(wù)定義文件 每行表示一個(gè)任務(wù),3列: 
1, ID 
2, 開始運(yùn)行時(shí)間 
3, 最大運(yùn)行時(shí)長(分鐘) 100,01:00:00,60 
110,02:00:00,30 任務(wù)依賴關(guān)系 每行表示一個(gè)關(guān)系,2列: 
1,前置任務(wù) 
2, 后置任務(wù) 100,110   問題:
  1, 下圖是ETL調(diào)度系統(tǒng)的模塊圖。請描述各個(gè)模塊的主要職責(zé),以及各個(gè)線條的含義。(10分)

  2, 添加依賴關(guān)系時(shí)要避免產(chǎn)生環(huán),假設(shè)系統(tǒng)同一個(gè)時(shí)刻只允許一個(gè)人添加任務(wù)依賴,請實(shí)現(xiàn)一個(gè)函數(shù)來檢查新的依賴是否導(dǎo)致環(huán),如果該依賴的上游存在環(huán)會導(dǎo)致非正常的調(diào)度,因此也希望能避免。(10分)
  a) 函數(shù)名:checkCycle
  b) 輸入:pairs,已存在的依賴關(guān)系((pre,post)),newPair新的依賴關(guān)系(pre,post)
  c) 輸出:True:不存在環(huán),F(xiàn)alse:存在環(huán)
  3, 如果調(diào)度時(shí),某個(gè)任務(wù)在其依賴的任務(wù)之前執(zhí)行,必然導(dǎo)致錯誤,請實(shí)現(xiàn)調(diào)度算法,確保任務(wù)按照依賴順序執(zhí)行?(10分)
  a) 函數(shù)名 schedule
  b) 輸入1:tasks,整型數(shù)組
  c) 輸入2:tasks-relations,二元組數(shù)組,每個(gè)二元組表示一組關(guān)系
  d) 輸出:task_id序列,并行執(zhí)行的用“,”分隔,其他的用“;”分隔
  4, 給定一個(gè)任務(wù),如何計(jì)算出他的最晚完成時(shí)間?(10分)
  a) 函數(shù)名:calMaxEndTime
  b) 輸入1:tasks,3元組數(shù)組,(task_id,start_time,max_run_time);
  c) 輸入2:task-relations,2元組數(shù)組,每個(gè)二元組表示一組關(guān)系;
  d) 輸入3:task-id
  e) 輸出:最晚完成時(shí)間;

【百度軟件研發(fā)工程師筆試題】相關(guān)文章:

百度軟件測試常見筆試題09-06

美團(tuán)網(wǎng)研發(fā)工程師筆試題08-29

百度筆試題目10-26

軟件測試工程師筆試題及答案10-10

百度校園招聘筆試題精選07-22

百度校招數(shù)據(jù)處理工程師筆試題10-02

百度測試工程師實(shí)習(xí)生崗位筆試題08-13

筆試面試題—軟件測試工程師06-15

百度上海數(shù)據(jù)處理工程師筆試題目06-12

百度網(wǎng)絡(luò)筆試題目07-19