首页 资讯 正文

度小满携AI反诈技术亮相Create2025百度AI开发者大会 让参会者体验防深伪技术

体育正文 215 0

度小满携AI反诈技术亮相Create2025百度AI开发者大会 让参会者体验防深伪技术

度小满携AI反诈技术亮相Create2025百度AI开发者大会 让参会者体验防深伪技术

近日,国外AI团队黑森林实验室(Black Forest Labs)宣布推出(tuīchū)新一代 AI 图像生成与编辑(biānjí)模型(móxíng)FLUX.1 Kontext,这是继去年 8 月首次发布Flux模型后,该团队在多模态生成领域的又一里程碑。据(jù)官方介绍,与传统(chuántǒng)文本到图像模型不同,FLUX.1 Kontext 首次实现了文本与图像双输入的上下文(shàngxiàwén)生成与编辑,允许用户通过自然语言指令直接修改现有(xiànyǒu)图像的局部或全局元素,同时保持角色一致性和视觉连贯性。 Flux.1 Kontext系列模型包括两个型号:Flux.1 Kontex [pro] 和(hé)(hé) Flux.1 Kontex [max]。Flux.1 Kontex [pro] 允许用户生成图像并通过多次(duōcì)回合对其进行优化(yōuhuà),保留字符和样式。Flux.1 Kontex [max] 强调速度(sùdù)、一致性和对提示的(de)遵守(zūnshǒu)。不过(bùguò),与以往的FLux模型不同,Flux.1 Kontex [pro] 和 Flux.1 Kontex [max] 无法下载(xiàzài)离线使用。然而,Black Forest Labs 正在制作一个开放(kāifàng)的 Kontext 模型 Flux.1 Kontext [dev],可用于私人测试版,用于研究和安全(ānquán)测试。 FLUX.1 Kontext采用流匹配架构(Flow Matching),彻底打破了文本编码器与(yǔ)扩散(kuòsàn)模型分离的(de)传统设计。通过将文本提示与参考图像的潜在特征编码为统一序列(xùliè),模型能够精准捕捉视觉(shìjué)概念与语义指令的关联,实现 “所见即所改” 的交互式创作。 这种架构带来四大(sìdà)核心优势: 1. 角色一致性(yízhìxìng):多轮编辑中保持人物身份特征,例如将角色从城市街道转移到雪山场景时,发型、服装等细节(xìjié)丝毫不差; 2. 局部编辑:支持像素级精准修改,如删除图像中的(de)杂物、调整特定区域色彩(sècǎi),而不影响其他部分; 3. 风格(fēnggé)参考:基于参考图像的风格生成新场景,例如将一张文艺复兴(wényìfùxīng)风格的油画转换为现代卡通风格,同时保留主体构图; 4. 交互(jiāohù)速度:1024×1024 分辨率下(xià)生成时间仅需 3-5 秒,比主流竞品快一个数量级,显著提升创意迭代效率。 5月31日,记者在官方(guānfāng)试玩平台(píngtái)Flux Playground上进行了多场景测试: 文本编辑:上传一张含有手写字的照片(zhàopiān),输入 “将文字改为Nanjing”,模型不仅准确修改文字内容,还自动调整排版与背景光影,使(shǐ)新标题与画面融为一体(róngwéiyītǐ)。 风格迁移:提供一张梵高的向日葵画作作为参考,输入 “用相同笔触绘制(huìzhì)一幅玫瑰画作”,生成的图像既保留印象派的色彩层次,又(yòu)精准还原玫瑰花(méiguīhuā)的细节。 图片编辑:尝试 “将(jiāng)戴珍珠耳环(ěrhuán)的(de)少女改成一个长发戴着宝石耳环和项链”的创意,模型同时处理少女的发型、项链、耳环等元素,最终输出的图像细节丰富。 值得注意的是,FLUX.1 Kontext 对中文(zhōngwén)提示词的理解能力也有不错(bùcuò)表现。例如输入“青砖黛瓦的江南水乡,细雨中撑伞的旗袍女子”,模型生成的画面不仅准确还原了中式建筑(jiànzhù)的韵味,人物服饰的纹理和动态也极具真实感(zhēnshígǎn)。
度小满携AI反诈技术亮相Create2025百度AI开发者大会 让参会者体验防深伪技术

欢迎 发表评论:

评论列表

暂时没有评论

暂无评论,快抢沙发吧~