百度申請圖像生成等專利,生成包括目標對象的編輯圖像

金融界2024年10月29日消息,國家知識產權局信息顯示,北京百度網訊科技有限公司申請一項名爲“圖像生成、大模型的訓練、圖像處理方法及裝置、設備和介質”的專利,公開號 CN 118823184 A,申請日期爲 2024 年 6 月。

專利摘要顯示,本公開提供了一種圖像生成、大模型的訓練、圖像處理方法及裝置、設備和介質,涉及人工智能技術領域,尤其涉及計算機視覺、深度學習、大模型等技術領域,可應用於AIGC、人機交互等場景。該圖像生成方法包括:獲取編輯文本和經加噪處理的原始圖像,編輯文本用於指示針對目標對象的編輯操作,經加噪處理的原始圖像未包括目標對象;分別對編輯文本和經加噪處理的原始圖像進行特徵提取處理,得到文本特徵和圖像特徵,文本特徵包括至少一個詞向量;根據文本特徵和圖像特徵,確定至少一個詞向量各自的特徵圖;根據至少一個詞向量各自的特徵圖,生成編輯圖像,編輯圖像包括目標對象。

本文源自:金融界

作者:情報員