谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能

金融界

2025/07/30

金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。

专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在给定从预训练的大型语言模型(LLM)中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。与诸如Imagen和DALL‑E 2的像素空间扩散模型相比，本文描述的示例模型由于使用了离散词元而明显更高效。与诸如Parti的自回归模型相比，本文描述的示例模型由于使用了并行解码而更高效。预训练的LLM的使用实现了细粒度的语言理解，从而转化为高保真图像生成以及对诸如对象、其空间关系、姿势、基数等的视觉概念的理解。

免责声明：投资有风险，本文并非投资建议，以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请，作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考，不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证，投资者应自行研究并在投资前寻求专业建议。

热议股票

1
2
3
4
5
6
7
8
9
10

{"basename":"/hans","ssrTDKData":{"titleTemplate":"%s - 老虎证券","title":"老虎证券全球投资理财平台| 一站式投资美股新股港股A股","description":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","keywords":"老虎证券,老虎证券开户,老虎券商,老虎证券官网,老虎证券app,tigertrade老虎证券,股票,炒股,新加坡股票交易平台,投资,投资理财","social":{"ogDescription":"老虎证券助您一站式投资美股，新股，港股，A股等全球金融理财产品。新加坡华人最信赖的在线投资平台，现在加入即享低费用，24/5 无时差炒美股投资理财！","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/hans/news/2555907070"},"companyName":"老虎证券"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2555907070\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2555907070?lang=zh_CN&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-07-30 14:32","share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","id":"2555907070","market":"hk","top_or_hot":-1,"title":"谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能","media":"金融界","content":"<html><body><div>\n<p>金融界2025年7月30日消息，国家知识产权局信息显示，<a href=\"https://laohu8.com/S/GOOG\">谷歌</a>有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。</p><p>专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在给定从预训练的大型语言模型(LLM)中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。与诸如Imagen和DALL‑E 2的像素空间扩散模型相比，本文描述的示例模型由于使用了离散词元而明显更高效。与诸如Parti的自回归模型相比，本文描述的示例模型由于使用了并行解码而更高效。预训练的LLM的使用实现了细粒度的语言理解，从而转化为高保真图像生成以及对诸如对象、其空间关系、姿势、基数等的视觉概念的理解。</p>\n<div>\n<div>\n</div>\n</div>\n</div></body></html>","source":"jinrongjie_stock","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能\n</h2>\n\n<h4 class=\"meta\">\n\n\n2025-07-30 14:32 北京时间&nbsp;&nbsp;&nbsp;<a href=https://finance.jrj.com.cn/2025/07/30143252081801.shtml><strong>金融界</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在...</p>\n\n<a href=\"https://finance.jrj.com.cn/2025/07/30143252081801.shtml\">网页链接</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU1935042991.SGD","symbol_name":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME  \"AA\" (SGDHDG) INC","start_time":0,"source_url":"https://finance.jrj.com.cn/2025/07/30143252081801.shtml","article_id":"2555907070","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2555907070","pubTimestamp":1753857135,"columns":[],"sourceInfo":{"source_id":"jinrongjie_stock","name":"金融界"},"weMediaInfo":null,"summary":"金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。在给定从预训练的大型语言模型中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。","collect":0,"end_time":0,"defaultTopTitle":"jrj.com.cn","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU1935042991.SGD":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME  \"AA\" (SGDHDG) INC","LU2404859667.USD":"FUNDSMITH EQUITY FUND \"R\" (USD) ACC","SG9999018857.SGD":"United Global Quality Growth Fd Cl Acc SGD-H","USJW.SI":"ALPHAB 3xLongSG261006","LU0251132253.USD":"FIDELITY FUNDS  GLOBAL THEMATIC OPPORTUNITIES \"A\" (USD) ACC","LU1633808545.USD":"ALLIANZ GLOBAL EQUITY GROWTH \"AT\" (USD) ACC","BK4554":"元宇宙及AR概念","LU0742534661.SGD":"Fidelity America A-SGD (hedged)","LU2063271972.USD":"富兰克林创新领域基金","LU0823434740.USD":"BNP PARIBAS US GROWTH \"C\" (USD) INC","LU0052756011.USD":"TEMPLETON GLOBAL BALANCED \"A\" (USD) INC","LU2471134879.HKD":"INVESCO GLOBAL EQUITY INCOME ADVANTAGE \"A\" (HKD) INC","LU0302445910.USD":"SCHRODER ISF GLOBAL CLIMATE CHANGE EQUITY \"A\" ACC","LU0289941410.SGD":"AB FCP I Dynamic Diversified AX SGD","LU1066051225.USD":"HSBC GIF GLOBAL EQUITY VOLATILITY FOCUSED \"AC\" (USD) ACC","LU1280957306.USD":"THREADNEEDLE (LUX) US CONTRARIAN CORE EQUITIES \"AUP\" (USD) INC","LU1145028129.USD":"ALLIANZ INCOME AND GROWTH \"AQ\" (USD) INC","LU0994945656.USD":"NINETY ONE GSF GLOBAL FRANCHISE \"A\" (USD) INC 2","BK4514":"搜索引擎","LU2491050071.SGD":"WELLINGTON SUSTAINABLE OUTCOMES \"A\" (SGDHDG) ACC","LU1066053197.SGD":"HSBC GIF GLOBAL EQUITY VOLATILITY FOCUSED \"AM3\" (SGDHDG) INC","LU0348723411.USD":"ALLIANZ GLOBAL HI-TECH GROWTH \"A\" (USD) INC","LU0203201768.USD":"AB SICAV I - ALL MARKET INCOME PORTFOLIO \"AX\" (USD) INC","IE0034235188.USD":"PINEBRIDGE GLOBAL FOCUS EQUITY \"A\" (USD) ACC","IE0004086264.USD":"BNY MELLON GLOBAL OPPORTUNITIES \"A\" (USD) ACC","LU0787776722.HKD":"AB SELECT US EQUITY PORTFOLIO \"A\" (HKD) ACC","LU0061475181.USD":"THREADNEEDLE (LUX) AMERICAN \"AU\" (USD) ACC","LU0238689110.USD":"贝莱德环球动力股票基金","LU0068578508.USD":"First Eagle Amundi International Cl AU-C USD","LU0072462426.USD":"贝莱德全球配置 A2","BK4612":"AI芯片","BK4592":"伊斯兰概念","LU1435385759.SGD":"Natixis Loomis Sayles US Growth Equity RA SGD-H","LU1868836591.USD":"CT (LUX) I AMERICAN \"1U\"(USD) ACC","LU1235294995.USD":"FIDELITY GLOBAL TECHNOLOGY \"A\" (USDHDG) ACC","IE00BK4W5L77.USD":"HSBC GLOBAL FUNDS ICAV US EQUITY INDEX \"HC\" (USD) ACC","LU1127390331.HKD":"AB SICAV I - ALL MARKET INCOME PORTFOLIO \"A\" (HKD) ACC","LU1066051811.HKD":"HSBC GIF GLOBAL EQUITY VOLATILITY FOCUSED \"AM2\" (HKD) INC","GOOG":"谷歌","LU1868836757.USD":"CT (LUX) I AMERICAN FUND \"2\" (USD) ACC","LU1815333072.USD":"THREADNEEDLE (LUX) GLOBAL FOCUS \"AUP\" (USD) INC","GB00B4QBRK32.GBP":"FUNDSMITH EQUITY \"R\" (GBP) INC","LU0130102774.USD":"Natixis Harris Associates US Equity RA USD","LU0130517989.USD":"HARRIS ASSOCIATES US VALUE EQUITY \"R\" INC","SG9999015978.USD":"利安颠覆性创新基金A","GOOGL":"谷歌A","LU0107464264.USD":"abrdn SICAV I - GLOBAL INNOVATION EQUITY \"A\" (USD) ACC","LU2326559502.SGD":"Natixis Loomis Sayles US Growth Equity P/A SGD-H","LU2089284900.SGD":"Allianz Global Sustainability Cl AM Dis H2-SGD","LU1935042215.USD":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME  \"AA\" (USD) INC A"},"translate_title":"Google Patents Text-to-Image Generation via Masked Generation TRANSFORMER for State-of-the-Art Image Generation Performance","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"GOOG":1,"USJW.SI":0.6,"GOOGL":1},"content_text":"金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在给定从预训练的大型语言模型(LLM)中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。与诸如Imagen和DALL‑E 2的像素空间扩散模型相比，本文描述的示例模型由于使用了离散词元而明显更高效。与诸如Parti的自回归模型相比，本文描述的示例模型由于使用了并行解码而更高效。预训练的LLM的使用实现了细粒度的语言理解，从而转化为高保真图像生成以及对诸如对象、其空间关系、姿势、基数等的视觉概念的理解。","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}