谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能

金融界

Jul 30, 2025

金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。

专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在给定从预训练的大型语言模型(LLM)中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。与诸如Imagen和DALL‑E 2的像素空间扩散模型相比，本文描述的示例模型由于使用了离散词元而明显更高效。与诸如Parti的自回归模型相比，本文描述的示例模型由于使用了并行解码而更高效。预训练的LLM的使用实现了细粒度的语言理解，从而转化为高保真图像生成以及对诸如对象、其空间关系、姿势、基数等的视觉概念的理解。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

1
2
3
4
5
6
7
8
9
10

{"basename":"","ssrTDKData":{"titleTemplate":"%s - Tiger Brokers","title":"Tiger Brokers | Global Stocks, Options & Futures Trading App","description":"Tiger Brokers, one-stop investment in US stocks, SGX stocks, HK stocks, A-shares & other global assets. One of the best stock trading platforms in Singapore.","keywords":"tiger brokers,tiger trade,tiger brokers singapore,broker online,stock trading in singapore,share trading singapore,brokerage firm singapore,trading app,stock broker singapore,stock trading platforms,trading account","social":{"ogDescription":"Tiger Brokers, one-stop investment in US stocks, SGX stocks, HK stocks, A-shares & other global assets. One of the best stock trading platforms in Singapore.","ogImage":"https://c1.itigergrowtha.com/portal5/static/media/og-logo.be62fbe1.png","ogUrl":"https://www.itiger.com/news/2555907070"},"companyName":"Tiger Brokers"},"pageData":{"isMobile":false,"isTiger":false,"isTTM":true,"region":"SGP","license":"TBSG","edition":"fundamental"},"isCrawlerRequest":true,"__swrFallback__":{"@#url:\"https://stock-news.skytigris.cn/v3/news\",params:#id:\"2555907070\",edition:\"fundamental\",auth_exemption:1,,,undefined,":{"share":"https://ttm.financial/m/news/2555907070?lang=en_US&edition=fundamental","thumbnail":"","is_english":false,"pubTime":"2025-07-30 14:32","share_image_url":"https://static.laohu8.com/e9f99090a1c2ed51c021029395664489","id":"2555907070","market":"hk","top_or_hot":-1,"title":"谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能","media":"金融界","content":"<html><body><div>\n<p>金融界2025年7月30日消息，国家知识产权局信息显示，<a href=\"https://laohu8.com/S/GOOG\">谷歌</a>有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。</p><p>专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在给定从预训练的大型语言模型(LLM)中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。与诸如Imagen和DALL‑E 2的像素空间扩散模型相比，本文描述的示例模型由于使用了离散词元而明显更高效。与诸如Parti的自回归模型相比，本文描述的示例模型由于使用了并行解码而更高效。预训练的LLM的使用实现了细粒度的语言理解，从而转化为高保真图像生成以及对诸如对象、其空间关系、姿势、基数等的视觉概念的理解。</p>\n<div>\n<div>\n</div>\n</div>\n</div></body></html>","source":"jinrongjie_stock","html":"<!DOCTYPE html>\n<html>\n<head>\n<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\" />\n<meta name=\"viewport\" content=\"width=device-width,initial-scale=1.0,minimum-scale=1.0,maximum-scale=1.0,user-scalable=no\"/>\n<meta name=\"format-detection\" content=\"telephone=no,email=no,address=no\" />\n<title>谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能</title>\n<style type=\"text/css\">\na,abbr,acronym,address,applet,article,aside,audio,b,big,blockquote,body,canvas,caption,center,cite,code,dd,del,details,dfn,div,dl,dt,\nem,embed,fieldset,figcaption,figure,footer,form,h1,h2,h3,h4,h5,h6,header,hgroup,html,i,iframe,img,ins,kbd,label,legend,li,mark,menu,nav,\nobject,ol,output,p,pre,q,ruby,s,samp,section,small,span,strike,strong,sub,summary,sup,table,tbody,td,tfoot,th,thead,time,tr,tt,u,ul,var,video{ font:inherit;margin:0;padding:0;vertical-align:baseline;border:0 }\nbody{ font-size:16px; line-height:1.5; color:#999; background:transparent; }\n.wrapper{ overflow:hidden;word-break:break-all;padding:10px; }\nh1,h2{ font-weight:normal; line-height:1.35; margin-bottom:.6em; }\nh3,h4,h5,h6{ line-height:1.35; margin-bottom:1em; }\nh1{ font-size:24px; }\nh2{ font-size:20px; }\nh3{ font-size:18px; }\nh4{ font-size:16px; }\nh5{ font-size:14px; }\nh6{ font-size:12px; }\np,ul,ol,blockquote,dl,table{ margin:1.2em 0; }\nul,ol{ margin-left:2em; }\nul{ list-style:disc; }\nol{ list-style:decimal; }\nli,li p{ margin:10px 0;}\nimg{ max-width:100%;display:block;margin:0 auto 1em; }\nblockquote{ color:#B5B2B1; border-left:3px solid #aaa; padding:1em; }\nstrong,b{font-weight:bold;}\nem,i{font-style:italic;}\ntable{ width:100%;border-collapse:collapse;border-spacing:1px;margin:1em 0;font-size:.9em; }\nth,td{ padding:5px;text-align:left;border:1px solid #aaa; }\nth{ font-weight:bold;background:#5d5d5d; }\n.symbol-link{font-weight:bold;}\n/* header{ border-bottom:1px solid #494756; } */\n.title{ margin:0 0 8px;line-height:1.3;color:#ddd; }\n.meta {color:#5e5c6d;font-size:13px;margin:0 0 .5em; }\na{text-decoration:none; color:#2a4b87;}\n.meta .head { display: inline-block; overflow: hidden}\n.head .h-thumb { width: 30px; height: 30px; margin: 0; padding: 0; border-radius: 50%; float: left;}\n.head .h-content { margin: 0; padding: 0 0 0 9px; float: left;}\n.head .h-name {font-size: 13px; color: #eee; margin: 0;}\n.head .h-time {font-size: 11px; color: #7E829C; margin: 0;line-height: 11px;}\n.small {font-size: 12.5px; display: inline-block; transform: scale(0.9); -webkit-transform: scale(0.9); transform-origin: left; -webkit-transform-origin: left;}\n.smaller {font-size: 12.5px; display: inline-block; transform: scale(0.8); -webkit-transform: scale(0.8); transform-origin: left; -webkit-transform-origin: left;}\n.bt-text {font-size: 12px;margin: 1.5em 0 0 0}\n.bt-text p {margin: 0}\n</style>\n</head>\n<body>\n<div class=\"wrapper\">\n<header>\n<h2 class=\"title\">\n谷歌申请经由掩蔽的生成TRANSFORMER的文本到图像生成专利，实现最先进的图像生成性能\n</h2>\n\n<h4 class=\"meta\">\n\n\n2025-07-30 14:32 北京时间&nbsp;&nbsp;&nbsp;<a href=https://finance.jrj.com.cn/2025/07/30143252081801.shtml><strong>金融界</strong></a>\n\n\n</h4>\n\n</header>\n<article>\n<div>\n<p>金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在...</p>\n\n<a href=\"https://finance.jrj.com.cn/2025/07/30143252081801.shtml\">Source Link</a>\n\n</div>\n\n\n</article>\n</div>\n</body>\n</html>\n","isBrief":false,"type":0,"news_type":1,"symbol":"LU2491050071.SGD","symbol_name":"WELLINGTON SUSTAINABLE OUTCOMES \"A\" (SGDHDG) ACC","start_time":0,"source_url":"https://finance.jrj.com.cn/2025/07/30143252081801.shtml","article_id":"2555907070","we_media_id":null,"thumbnails":[],"rights":null,"url":"https://stock-news.laohu8.com/highlight/detail?id=2555907070","pubTimestamp":1753857135,"columns":[],"sourceInfo":{"source_id":"jinrongjie_stock","name":"金融界"},"weMediaInfo":null,"summary":"金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。在给定从预训练的大型语言模型中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。","collect":0,"end_time":0,"defaultTopTitle":"jrj.com.cn","property":[],"viewcount":null,"language":"zh","relate_stocks":{"LU2491050071.SGD":"WELLINGTON SUSTAINABLE OUTCOMES \"A\" (SGDHDG) ACC","LU0238689110.USD":"贝莱德环球动力股票基金","LU0068578508.USD":"First Eagle Amundi International Cl AU-C USD","LU0072462426.USD":"贝莱德全球配置 A2","LU1868836591.USD":"CT (LUX) I AMERICAN \"1U\"(USD) ACC","BK4514":"搜索引擎","LU1435385759.SGD":"Natixis Loomis Sayles US Growth Equity RA SGD-H","LU1066051811.HKD":"HSBC GIF GLOBAL EQUITY VOLATILITY FOCUSED \"AM2\" (HKD) INC","LU1127390331.HKD":"AB SICAV I - ALL MARKET INCOME PORTFOLIO \"A\" (HKD) ACC","IE00BK4W5L77.USD":"HSBC GLOBAL FUNDS ICAV US EQUITY INDEX \"HC\" (USD) ACC","LU1235294995.USD":"FIDELITY GLOBAL TECHNOLOGY \"A\" (USDHDG) ACC","LU1868836757.USD":"CT (LUX) I AMERICAN FUND \"2\" (USD) ACC","GB00B4QBRK32.GBP":"FUNDSMITH EQUITY \"R\" (GBP) INC","USJW.SI":"ALPHAB 3xLongSG261006","LU1815333072.USD":"THREADNEEDLE (LUX) GLOBAL FOCUS \"AUP\" (USD) INC","LU0289941410.SGD":"AB FCP I Dynamic Diversified AX SGD","LU0130517989.USD":"HARRIS ASSOCIATES US VALUE EQUITY \"R\" INC","LU2471134879.HKD":"INVESCO GLOBAL EQUITY INCOME ADVANTAGE \"A\" (HKD) INC","LU0130102774.USD":"Natixis Harris Associates US Equity RA USD","SG9999015978.USD":"利安颠覆性创新基金A","LU0742534661.SGD":"Fidelity America A-SGD (hedged)","LU0107464264.USD":"abrdn SICAV I - GLOBAL INNOVATION EQUITY \"A\" (USD) ACC","LU2326559502.SGD":"Natixis Loomis Sayles US Growth Equity P/A SGD-H","SG9999018857.SGD":"United Global Quality Growth Fd Cl Acc SGD-H","LU2089284900.SGD":"Allianz Global Sustainability Cl AM Dis H2-SGD","LU1280957306.USD":"THREADNEEDLE (LUX) US CONTRARIAN CORE EQUITIES \"AUP\" (USD) INC","BK4612":"AI芯片","BK4592":"伊斯兰概念","LU1935042215.USD":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME  \"AA\" (USD) INC A","LU1935042991.SGD":"MANULIFE GF GLOBAL MULTI-ASSET DIVERSIFIED INCOME  \"AA\" (SGDHDG) INC","LU2404859667.USD":"FUNDSMITH EQUITY FUND \"R\" (USD) ACC","LU1633808545.USD":"ALLIANZ GLOBAL EQUITY GROWTH \"AT\" (USD) ACC","LU0251132253.USD":"FIDELITY FUNDS  GLOBAL THEMATIC OPPORTUNITIES \"A\" (USD) ACC","LU2063271972.USD":"富兰克林创新领域基金","IE0034235188.USD":"PINEBRIDGE GLOBAL FOCUS EQUITY \"A\" (USD) ACC","LU0823434740.USD":"BNP PARIBAS US GROWTH \"C\" (USD) INC","LU0052756011.USD":"TEMPLETON GLOBAL BALANCED \"A\" (USD) INC","LU0302445910.USD":"SCHRODER ISF GLOBAL CLIMATE CHANGE EQUITY \"A\" ACC","GOOG":"谷歌","LU1066051225.USD":"HSBC GIF GLOBAL EQUITY VOLATILITY FOCUSED \"AC\" (USD) ACC","LU1145028129.USD":"ALLIANZ INCOME AND GROWTH \"AQ\" (USD) INC","GOOGL":"谷歌A","LU0994945656.USD":"NINETY ONE GSF GLOBAL FRANCHISE \"A\" (USD) INC 2","LU0203201768.USD":"AB SICAV I - ALL MARKET INCOME PORTFOLIO \"AX\" (USD) INC","LU0348723411.USD":"ALLIANZ GLOBAL HI-TECH GROWTH \"A\" (USD) INC","LU1066053197.SGD":"HSBC GIF GLOBAL EQUITY VOLATILITY FOCUSED \"AM3\" (SGDHDG) INC","LU0061475181.USD":"THREADNEEDLE (LUX) AMERICAN \"AU\" (USD) ACC","BK4554":"元宇宙及AR概念","IE0004086264.USD":"BNY MELLON GLOBAL OPPORTUNITIES \"A\" (USD) ACC","LU0787776722.HKD":"AB SELECT US EQUITY PORTFOLIO \"A\" (HKD) ACC"},"translate_title":"Google Patents Text-to-Image Generation via Masked Generation TRANSFORMER for State-of-the-Art Image Generation Performance","themeId":null,"isJumpTheme":false,"ttsUrl":null,"symbols_score_info":{"GOOGL":1,"GOOG":1,"USJW.SI":0.6},"content_text":"金融界2025年7月30日消息，国家知识产权局信息显示，谷歌有限责任公司申请一项名为“经由掩蔽的生成TRANSFORMER的文本到图像生成”的专利，公开号CN120390939A，申请日期为2023年12月。专利摘要显示，提供了文本到图像Transformer模型，其实现最先进的图像生成性能，同时比扩散或自回归模型显著更高效。本文描述的一些示例模型可在离散词元空间中的掩蔽的建模任务上进行训练。在给定从预训练的大型语言模型(LLM)中提取的文本嵌入的情况下，可训练示例模型来预测随机掩蔽的图像词元。与诸如Imagen和DALL‑E 2的像素空间扩散模型相比，本文描述的示例模型由于使用了离散词元而明显更高效。与诸如Parti的自回归模型相比，本文描述的示例模型由于使用了并行解码而更高效。预训练的LLM的使用实现了细粒度的语言理解，从而转化为高保真图像生成以及对诸如对象、其空间关系、姿势、基数等的视觉概念的理解。","kind":"news","is_publish_news":true,"is_publish_highlight":false,"is_publish_live":false,"is_publish_wemedia":null,"editions":null,"column":"","sentiment":"0","news_tag":"","news_rank":0,"symbols":[],"gpt_button":0,"need_auth":false,"code":"91000000","status":"200"}}}