中通服軟件科技申請基於單模態監督對比學習和推理增強的視覺問答專利,提高問答模型推理能力和可解釋性

金融界 2024 年 10 月 24 日消息,國家知識產權局信息顯示,中通服軟件科技有限公司申請一項名爲“一種基於單模態監督對比學習和推理增強的視覺問答方法、系統、設備及介質”的專利,公開號 CN 118797557 A,申請日期爲 2024 年 9 月。

專利摘要顯示,本發明涉及視覺問答技術領域,具體地說,涉及一種基於單模態監督對比學習和推理增強的視覺問答方法、系統、設備及介質;該方法在對比學習訓練階段,考慮單模態信息的有效性,將圖像的類型和文本內容的類型表示爲類型點,並將類型點作爲弱監督的方法引導自監督對比學習的過程,減輕不可信、質量差的樣本對對比學習效果的影響;在問答任務的微調階段,分別不同問題類型的推理能力,並通過問題類型注意力引導融合得出答案,提高了問答模型的推理能力和可解釋性。

本文源自:金融界

作者:情報員