行业大咖说 | 东华大学闻力生教授《服装制造业必须认知AI大模型及其应用》

图片

   服装制造业必须认知AI大模型及其应用   

作者 | 闻力生

中国服装智能制造联盟专家组  副组长

东华大学教授


2023年4月28日和5月5日党中央工作会议上提出了关于人工智能发展的三个第一次,即:第一次提出“通用人工智能”,第一次提出“产业智能化”,第一次提出“要把握人工智能等新科技革命浪潮”, 可见党中央对人工智能AI发展十分重视。

根据AI当前发展情况来看,我们现在已经处在AI大模型时代,大模型各种各样,其参数规模不断提升,行业应用不断拓展,从整体来看, AI大模型不仅可以生成文字、可以生成图片,而且可以生成代码,构建人机交互新模式,它还能与产品研发、工艺设计、生产作业、产品运营等制造环节、场景相结合,提高生产效率,形成新的生产力,从而引发整个产业格局的重构。

那么什么是AI大模型呢?它在我们服装制造业进行智能化转型中又有什么作用呢?


AI大模型定义及其相关概念


(1)AI大模型定义与类型:

AI大模型是指具有巨大参数量规模的人工智能模型,这些模型通过机器学习和深度学习的技术来学习和理解庞大的数据量。这些模型能够解决多种任务,适应不同的业务场景和语言环境,并且能够不断进行训练和优化,以实现更高效、更准确的语义理解和应用。

目前市场上公司及研究院校所等发布的AI大模型一般参数量是从10亿参数到上千亿参数,根据我国科技部2023年的统计,中国10亿参数量规模以上的大模型已发布了79个,美国发布已超过100个。

AI大模型有自然语言处理、计算机视觉和语音识别三个大领域,见图一。正因为有了这三个大领域,才构成了人工智能的丰富世界,它们也才能够让机器更深入地理解我们的语言、图像和声音,从而为我们人类提供更智能、更便捷的服务。

图片

图一  AI大模型领域


在这三个领域中以大语言模型LLM(Large Language Model)和计算机视觉大模型CV(Computer Vision)较为常见。LLM大模型主要用于处理自然语言任务,如文本生成、情感分析、问答系统等。这类模型通过对大量文本数据进行训练,学习到了语言的语法、语义和上下文相关性,从而能够理解和生成自然语言文本;CV大模型,即计算机视觉模型,主要用于处理图像和视频相关的任务,如图像分类、目标检测、人脸识别等。

这类模型通过对大量图像数据进行训练,学习到了图像的特征表示和分类规则,从而能够进行图像的分类和目标检测等任务。除此之外还有自然语言处理NLP大模型和强化学习RL大模型也是常见的AI大模型类型,但它们的应用范围相对较窄。NLP大模型主要用于自然语言处理任务,如文本摘要、机器翻译等;而RL大模型主要用于强化学习任务,通过与环境的交互学习最优策略。总的来说,AI大模型的应用取决于具体的任务和场景,不同类型的模型各有其优势和局限性。

当前典型的LLM大模型包括我们熟悉的OpenAI的GPT系列、Google的BERT模型等。在已经过去的2023 年,最具影响的 GPT-4、ChatGPT 凭一己之力掀起了 AI 领域的热潮,火爆全球。特别是ChatGPT 入选了2023 年度《Nature》十大人物(Nature’s 10),这是有史以来第一次以一个“计算机程序”——非人类实体作为人物入选。同时,我国国家语言资源监测与研究中心、商务印书馆等单位联合主办的“汉语盘点2023”公布的年度国际词,同样是ChatGPT。ChatGPT让大模型席卷全球,大模型被全球科技领袖定义为一次颠覆式科技革命。

我曾经说过,GPT是英文字首(Generative Pre-trained Transformer),可以叫“生成性预训练变换模型”,也可以叫“生成性人工智能”,是基于自然语言处理NLP基础上发展起来的大数据、大算力、大模型。现在的GPT就是新一代人工智能发展的代表,它可以说是以现在的机器学习和深度学习等为主体,在其基础上参考人脑的计算机制,构建机器的学习和推理智能系统,这些都是在Transformer模型基础上发展起来的,见图二。

图片

图二 LLM大模型发展的基础


Transformer 模型是深度学习中的一种神经网络模型,该模型2017年是由 Google开源的,目前Transformer 模型已经成为自然语言处理领域中最流行的模型之一。Transformer架构是一种基于自注意力机制的神经网络架构,它在处理序列数据和建模语言相关性方面表现出色,见图三。

图片

图三  Transformer 模型架构(英中文)


由图可见,Transformer架构由编码Encoder和解码Decoder两部分组成,每部分均可堆叠多层,其工作流程分下面五步:①输入处理--将输入序列通过Embedding(嵌入技术)层转化为向量,并加上位置编码;②Encoder编码处理--经过多头自注意力层和前馈神经网络层,输出编码后的向量;③Decoder解码处理--在解码阶段,除了自注意力机制外,还引入Encoder-Decoder Attention(编码器-解码器注意力),使Decoder能够关注Encoder的输出;④输出生成--通过线性层和softmax函数,将Decoder的输出转化为预测词汇的概率分布;⑤输出应用。

这里要注意的是虽然先进的大模型确实使用了Transformer架构作为基础,但并非所有的大模型都是基于Transformer架构构建的。事实上,有许多其他的架构也被广泛应用于大模型的构建,这些架构根据任务和领域的不同而有所差异。例如,卷积神经网络(CNN)在图像处理领域中被广泛使用,循环神经网络(RNN)在处理序列数据和自然语言生成中得到了广泛应用等等。

根据大语言模型LLM用途来分,它还可以分为通用大语言模型LLM和专业用大语言模型LLM, 专业用大模型又有它的独特构建方式,见图四。

图片

图四  大语言模型LLM分类(图源:coggle)


(2)大语言模型LLM的构建流程

我们通常所使用的大语言模型LLM的构建流程是以OpenAI推出的流程为代表的,其流程如图五所示。它主要包含四个阶段:预训练、有监督微调、奖励建模、强化学习。这四个阶段都需要不同规模数据集合、不同类型的算法,产出不同类型的模型,所需要的资源也有非常大的不同。

图片

图五  大语言模型构建流程


(3) 国内外著名的大语言模型LLM

目前大语言模型LLM的发展表现如下:在国外,首当其冲的是OpenAI推出的基于GPT-4 的大型语言模型 ChatGPT,其次是Google、Microsoft、Meta和NVIDIA等推出的大型语言模型;在国内目前有百度、金山、智谱、百川、字节、商汤、中科院(紫东太初)等企业和机构等推出的大模型,见图六。但经过最近的几个月发展,国内大模型发展比较有名的已有十五家之多,见图七

图片

图六 国内外著名的大语言模型


图片

图七 国内目前著名的大模型


(4)语言大模型LLM与多模态大模型

  所谓多模态大模型是指一种能够处理多种类型数据的机器学习模型,如文本、图像、音视频数据等,并在这些数据之间建立关联。因为我们人类生活在一个多模态信息数据构成的世界,需要通过视觉、听觉、触觉、嗅觉等感官来接收和理解外部的信息,或者通过语言、文字、图画、音乐等方式来表达和传递信息,所以我们十分需要多模态大模型。

但是在人工智能的发展历史上,大多数的模型都是基于单一模态的数据来进行学习和推理的,那么除了多模态大模型之外,有没有一个单一模态的大模型发展成为多模态大模型呢?回答是有的。其实,语言大模型LLM通常就被认为具有多模态特征,因为它可以处理不仅仅是文本数据,还包括语音、图像和其他类型的数据。这意味着大型语言模型(LLM)可以看作是处理多模态数据的一种形式,特别是当这些模型被用于理解或生成不同模态(如视觉、语音等)的信息时。

例如,多模态大型语言模型(MLLM)可以利用大型语言模型(LLM)作为大脑来执行多模态任务。当它们扩展到多模态数据时,它们能够处理和理解来自不同源的信息,例如图像、音频和视频。但需要注意的是,虽然LLM大模型可以处理多模态特征,但它在处理视觉数据方面可能没有专门设计的CV大模型的性能和精确度。所以,对于特别侧重于视觉处理的任务,使用专门设计的CV大模型可能更适合。


(5)生成式AI、AIGC和LLM三者的区别

生成式AI、AIGC和LLM三者都是人工智能领域的重要分支,各自展现了独特的魅力和功能,但它们各自有不同的侧重点和应用场景。

生成式AI(Generative AI)是指能够模拟人类智能生成新的、真实的、有用的信息的AI技术。这种技术通过学习大量的数据,能够生成与现实世界类似的新图像、音频、视频等。例如,生成式AI可以用于艺术创作、文本生成、音乐制作等领域;AIGC(Artificial Intelligence Generated Content)是人工智能领域的一个新概念,它指的是由人工智能生成的符合用户需求和偏好的内容。这种内容可以是文本、图像、音频、视频等各种形式。AIGC是AI领域的技术集合,包括深度学习、机器学习、自然语言处理等。

AIGC更侧重于生成全新的、原创的内容,往往具有更高的创新性和独特性;LLM(Large Language Model)是大型语言模型,是一种基于深度学习技术的自然语言处理模型。它能够理解和生成人类语言,包括文本、语音等。LLM通常被用于自然语言处理任务,如机器翻译、文本生成、情感分析等。总之生成式AI、AIGC和LLM三者的区别在于它们的侧重点和应用场景。生成式AI侧重于模拟人类智能生成新的信息,AIGC侧重于生成全新的、原创的内容,而LLM则是一种基于深度学习技术的自然语言处理模型。


(6)大语言模型 LLM与智能助理(或智能代理)AI Agent

  AI Agent的正确名称是人工智能代理(Artificial Intelligence Agent),它是一个能够感知环境、进行决策和执行动作的智能实体, 它不同于传统的人工智能,它是一个复杂的AI系统,它能通过感知信息、处理信息、执行任务和输出结果等步骤,实现从感知到行动的完整过程。

AI Agent和LLM(大型语言模型)之间的关系非常密切。简单来说,LLM好比是 Agent的大脑,它能为AI Agent提供了强大的语言处理能力和文本生成能力,

而AI Agent则通过利用LLM的这些能力,进一步与环境交互、主动决策并执行各种任务。因此,LLM是AI Agent的核心组成部分,它为AI Agent提供了驱动和支撑。

由AI与人类的交互模式发展来看(见图八),AI Agent模式能够自主调用资源完成任务,人类在其中只起到设立目标、监督结果和评估的作用。可见AI Agent能具有更广泛的应用范围,可处理多个任务,并能在不同领域中执行各种功能行动;它还具有更自然和灵活的交互方式,能够理解复杂的自然语言指令,与用户进行更智能的对话等。

图片

图八  AI Agent与人类的交互模式(图源:网络)


AI Agent通常还被视为是大模型落地业务场景的主流形式, 是企业构建智能的未来,也是人类的理想智能助手。根据IDC调研显示:所有受访企业都认为AI Agent是发展的方向,现在有 50%的企业已经在某项工作中进行了AI Agent的试点,另有34%的企业正在制定AI Agent的应用计划,见图九。

图片

图九AI Agent在企业应用


(7)SORA与LLM关系

OpenAI 在 2024 年 2 月16 日发布了 Sora,这是一个文本到视频的生成 AI 模型,能够根据文本提示生成现实或富有想象力的场景视频。Sora本身是一个专门设计用于视频生成和处理的模型,其重点在于将文本描述转化为视觉内容。它并不是直接依赖LLM来生成视频内容的。相反,Sora使用其内部的深度学习架构和算法来将文本转化为视觉元素,并生成最终的视频输出。

在SORA文生视频架构中,LLM大模型常被用作文本到视频生成的核心组件。LLM大模型可以接受文本输入,并生成对应的文字描述或说明,作为视频生成的基础。通过将LLM大模型与其他图像处理和动画生成技术结合起来,可以实现基于文本的视频生成。因此,SORA文生视频架构和LLM大模型之间存在一定的关联,LLM大模型是视频生成的重要组成部分之一。


(8)大模型训练面临的挑战与解决之道

虽然大型语言模型 (LLM) 彻底改变了自然语言处理和理解领域,实现了跨各个领域的广泛人工智能应用。然而部署 LLM 应用程序也面临着一系列挑战,例如:在数据算法算力的资源挑战;训练环境与能源的挑战;大模型产生的勾觉及偏见等等的挑战,见图十。

图片

图十  大模型训练面临的挑战(图源--数字化助推器)


目前解决大模型训练所面临的挑战有下面一些方法:例如为了解决算法算力等问题可以使用更高效的硬件,如GPU、TPU(张量处理单元)或ASIC(应用特定集成电路);通过将模型训练分散到多个计算节点上进行分布式训练,可以显著加快训练速度;利用优化算法以减少所需的计算量等; 使用可再生能源为数据中心供电,以降低能源消耗和减少碳排放等等。

除此之外还常用搜索增强生成RAG--Retrieval Augmentation Generation)、微调(Fine-tuning)和提示工程(Prompt Engineering)来解决在大型语言模型(LLM)的训练和应用中出现的不同问题。所谓LLM微调是一个将预训练模型在较小、特定数据集上进一步训练的过程,目的是精炼模型的能力,提高其在特定任务或领域上的性能。微调的目的是将通用模型转变为专用模型,弥合通用预训练模型与特定应用需求之间的差距,确保语言模型更贴近人类的期望。而所谓搜索增强生成RAG,它是微调的一种替代方法,它结合了自然语言生成和信息检索。RAG确保语言模型通过外部最新知识或相关文档提供信息来源。这种技术弥合了通用模型广泛知识与最新知识信息需求之间的差距,RAG是事实随时间演变情况下的重要技术。

通过应用搜索增强生成可以解决以下问题:①通过应用搜索增强生成可以解决长尾知识问题——大型语言模型往往在处理常见的、频繁出现的问题时表现良好,但在处理长尾、罕见或特定领域的问题时可能会遇到困难。通过增强检索,可以将模型与外部知识源(如数据库、互联网等)结合起来,以提供准确的信息和上下文;②通过应用搜索增强生成可以提高非幻觉率——如前所述,大型语言模型有时会产生误导性的、不真实的或“幻觉”的回答可以通过增强检索,验证模型的回答,确保它们基于可靠和准确的信息;③通过应用搜索增强生成可以提高效率和响应速度——对于某些问题,直接检索相关信息可能比从头开始生成回答更为高效。这可以减少计算时间并提高系统的响应速度。

同样, 通过应用微调可以解决以下问题:①通过微调可以使大模型适应特定任务或领域——微调是一种使大型预训练模型适应特定任务或数据集的方法。通过微调,模型可以学习特定领域的细节和规则,从而在该领域表现得更好;②通过微调可以使大模型型减少偏见和勾觉——微调可以帮助模型减少在特定数据集上的偏见和过拟合;③通过在具有多样性和代表性的数据集上进行微调,模型可以学习更普遍和可泛化的特征;④通过微调可以使大模型型提高性能和效率——微调通常可以提高模型在特定任务上的性能,因为它允许模型专注于学习与该任务最相关的特征。这可以减少计算资源和能源消耗,同时提高模型的准确性和效率。

同样,提示及提示工程(Prompt Engineering)在大型模型训练中的作用主要体现在以下几个方面:

①通过提示及提示工程可以引导模型理解和生成——提示工程通过设计和优化输入提示词,引导模型生成高质量、准确和有针对性的输出。这些提示词实质上是我们发给大模型的输入(指令),模型会根据这些指令,结合其预训练的“知识”,输出与指令相关的内容;

②通过提示及提示工程可以提高模型性能——对于基于转换器的大型语言模型(如OpenAI的GPT系列),输入提示在提高模型理解、回答问题、生成有用输出等方面具有关键作用。通过构建清晰、简洁的问题,提供必要的上下文信息,或者使用间接、分步的引导方式,提示工程可以帮助模型更好地理解问题并生成更有价值的回答;

③通过提示及提示工程可以促进人机交互——提示工程也是一种人机交互的方式。通过高质量的提问,我们可以引导模型生成我们想要的输出,这对于开发用户友好、易于交互的AI系统具有重要意义。

最后,还需注意大模型LLM的推理准确性和泛化能力是一个机器学习领域的研究问题,一般都需要从以下6个方面来探讨,即:

①增加数据量——更多的数据能让模型更充分地认识所要识别的问题,学到更加共性的信息;

②处理缺失值和异常值——训练数据中意外的缺失值和异常值通常会降低模型的准确率,或使模型产生的结果出现偏差,最终导致预测不准;

③使用正则化方法——正则化是一种防止模型过拟合的技术,包括提前终止和模型集成等。提前终止是在泛化误差指标不再提升后,提前结束训练;

④采用复杂模型——一些复杂的模型,如深度神经网络,能够更好地学习和表示数据的复杂特征,从而提高推理的准确性和泛化能力;

⑤数据增强:对数据进行增强可以扩充数据集,提高模型的泛化能力;

⑥使用贝叶斯模型——贝叶斯模型能够根据已有的数据进行概率推断,对于新的、未知的数据有一定的预测能力,可以提高泛化能力。


AI大模型在服装制造业智能化转型中的应用


AI大模型事关人类生产工具的变革,事关一个国家制造业核心竞争力的重塑,事关经济的长期繁荣。AI大模型是重塑全球制造业竞争格局的新起点,AI大模型也是加速数实融合浪潮的又一次到来,其主要特征和目标是制造业转型的智能化。AI大模型将影响制造业发展格局,AI大模型将会融入制造业的研发设计、生产工艺、质量管理、运营控制、营销服务、组织协同和经营管理等方面,见图十一。

图片

图十一  大模型融入制造业(图源:安筱鹏)


大模型分为通用大模型和专业大模型(图四)。通用大模型是在大规模语料(互联网,百科,电子书)上预训练完成,例如GPT,Bert。

专业大模型是在通用大模型基础上,通过微调或者提示工程使其善于完成某个下游任务,例如,ChatGPT。根据Gartner 预测,到 2026 年,超过 80%的企业将使用生成式 AI 的 API 或大模型,或在生产环境中部署支持生成式 AI 的应用,而在 2023 年初这一比例不到 0.5%。所以生成式AI及大模型未来发展的空间非常巨大。生成式 AI及大模型正在迅速走向应用落地,生成式 AI及大模型有望为全球经济贡献约 7 万亿美元的价值,并将 AI 的总体经济效益提高 50%左右;中国则有望贡献其中约 2 万亿美元,将近全球总量的 1/3。

面对这样的形势,由于我们服装制造业存在对大模型的认知不足,行业和企业的算力和数据样本不足,以及对大模型应用经验不足等原因,影响了对AI大模型的应用,所以我们现在应该奋起直追,认知好和应用好它。AI大模型应用在服装制造业转型于智能化主要要有以下几个方面的认知:


(1)大小模型协同是AI大模型赋能制造业的重要趋势

图片

图十二  制造业中大小模型的应用与协同


在服装制造业转型于智能化中应用好大模型和小模型是一个重要的趋势,见图十二。大模型的代码生成、CAD生成和泛化等能力强,而小模型完成单个场景特别任务又特别好,所以我们在服装制造业转型于智能化中主张两者协同应用。另外值得一提的是智能代理AI Agent是大小模型高度协同的重要载体,所以它将成为新的生产工具。

前面说过AI Agent将LLM与其他模型、软件等外部工具协同,能够处理真实世界中的各种复杂任务。未来在制造业AI Agent主要由“感知系统+控制系统+执行系统”组成,它不仅具有生成能力,还将同时具备任务理解、任务拆解、任务调度、执行规划、链条协同等能力。其中LLM将主要承担指挥中心角色,类似人类“大脑”的角色,对接入AI Agent的数字化工具(比如工业软件、工业机器人、数字人等)进行统一智能调度管理,实时在生产、管理、服务等场景中,由不同组合的数字化工具协同完成具体任务。


(2)大模型生成代码的价值在于服装制造业所用的软件都需要基于AI大模型重新做一遍

由上面大模型LLM介绍可知,它能生成文本、图片、代码、语音和视频,但在这些当中生成代码的价值被往往被忽略被低估。其实要实现制造业智能化一定要将所有的软件基于AI重新做一遍,这里所有包括Windows、Office等办公软件、企业用的MES、WMS、PLM、ERP、CRM、SCM、PLC、SCADA等工业软件会被重新做一遍。

所有软件将由AI大模型驱动,这样软件才能从数字化或在线化走向真正的智能化。未来不但如此,所有的智能硬件如手机、计算机、智能家电、摄像头、机器人、AGV小车、加工机械等也将被AI大模型驱动,见图十三。

图片

图十三  AI大模型驱动软硬件(图源:安筱鹏 )


(3)大模型用于服装前瞻化设计

大模型可以生成创新性的产品设计方案,从而更好地辅助技术人员快速将设计构思和意图转化为具体实施方案, 生成多样化设计方案。例如一般独立设计师的初创品牌会结合 AI 绘画Midjourney工具和 AIGC大模型等工具,发挥自己的创意想象力,进行服装版型设计。

不过版型设计对于 AI大模型的能力要求是比较复杂的,既要独一无二的创意,又需要结合自己的品牌风格,只有设计师利用大模型进行微调和提示工程才能做到,其服装版型设计结果见图十四。又例如阿里巴巴开发的多模态大模型M6已成功应用于犀牛服装服装新制造,实现了文本到图像生成等多种应用案例。传统服装设计过程中,设计师需要花费很长的时间设计衣服并进行线上样款测试,但基于文本到图像生成技术,可以直接输入流行的服装款式描述到M6模型中生成相应款式图片。

这项技术将原本冗长的设计流程压缩了超过十倍的时间,目前已经商业投产,并且与三十多家服装商家在去年双十一期间成功地进行了合作。再如凌迪Style3D在应用AI大模型技术打通了“AI+3D+AI”的路径以后,在服装商品企划设计段,帮助设计师运用AI大模型深度学习能力,通过以文生款、以款生款、线稿成款、融合创款、AI局部编辑、AI试衣等功能,快速创造、还原、修改设计创意,加速设计灵感迸发。图片

图十四 大模型微调与提示后的设计(图源:WWD CHINA)


(4)AI大模型能弥合服装制造业的数据流断点

AI大模型带来了新的人机交互方式,未来大模型将能操控一切,深刻改变生产制造等的方式。过去在我们服装制造业进行数字化转型是以传统软件的方式达到数据能够自动流动为目的。但从客户需求产品到获得产品整个过程中,制造企业在多个环节中存在数据流断点,往往需要工程师来开发各种工艺软件和流程软件,现在有了AI大模型将改变这一状况,它使现在基于文本的信息流转变为基于模型的信息流,见图十五。

图片

图十五 服装制造业基于模型的信息流(图源:安筱鹏)

基于AI大模型的自然语言交互能力,为制造业企业内部各环节之间的实时、泛在的连接提供了软件开发、交互的新方式,降低了工艺和流程的软件开发门槛、提高了效率,弥合了企业数据流动过程中的无数个断点。这一功能大大降低了工艺开发人员的门槛,提高了开发效率和质量。从全局来看,不仅能避免出现数据断点,减少人工干预带来的影响,而且提高了整个系统的智能化水平。


(5)AI大模型能在服装制造业生产线上实现智能化调控

智能化调控在现代服装制造业生产线中,需要对多个关键节点进行智能化调度和控制,以提升产线运行效率。人工智能大模型可以通过分析多样化的历史数据,更好地理解诸如生产需求、资源可用性、任务优先级等工业调度任务中的复杂关系,从而优化各节点的任务分配和调度,提高生产效率和灵活性。这一调控典型做法是在SCADA(数据采集与监视控制系统)场景下,利用大模型在生产线场景下的编程接口和生态库,生成工业逻辑代码(交互、建模、SQL开发)并自动集成到工业软件中,用它来进行闭环优化控制。


(6)AI大模型能用于服装定制化服务

大模型可以凭借在文本生成、图像生成和自然语言对话等方面的优势,使服服装定制服务不仅仅是问与答,可让客户直接根据自己需要进行修改,这样就进一步提升了客户忠诚度和满意度。例如阿里巴巴的多模态大模型M6,利用提供文本到图像生成的能力,可根据客户需求,不断完善其生成结果。在给定一张衣服图像时,用户可以在保留其领子后进一步进行个性化改进,每改进一次可以生成改进一部分的token,随后进行多次迭代后,其生成的衣服图像结果就会越来越好,直到客户满意。


(7)90%以上的中小微服装制造业数智化转型可以利用AI大模型服务平台了

大模型的出现为广大中小微服装制造业数智化转型和高质量发展带来很好的技术支撑。针对服装制造业做大模型的阿里巴巴、海尔、创新奇智、商汤科技等,他们的推出的大模型平台除了自己应用外,还给更多的中小微制造企业服务。除此之外,我国还发展了一批面向更多中小微企业的大模型平台服务企业。例如广州致景公司专为服装设计的建模和服装工厂的管理服务;山东橙色云专为企业设计承接和转包大模型平台,现在已经有上万家中小微企业在他们平台上发布需求服务了;深圳云工科技,利用大模型平台专门为企业需要订货服务,仅去年下半年就下单了100亿的交易;江苏智云天工和三一重工做了一个虚拟工厂和供应链管理大模型平台,可为企业做到生产流程最优和零库存或少库存管理等等。


(8)利用AI大模型对衣片或成衣进行质量检测

衣片和成衣的质量检测主要涉及到对图像和视觉信息的处理和分析,比如检测衣片上的瑕疵、线头、污渍等,或者检测成衣的缝合质量、尺寸是否符合标准等。这些任务都需要对图像进行深入的分析和理解,一般使用CV大模型更为适合。
AI大模型在衣片和成衣质量检测中,需要使用到一些特定的硬件设备和设施,如高性能计算机、图像采集设备、数据存储设备以及数据传输设备等。AI大模型在衣片和成衣的质量检测上一般是通过以下步骤进行的:需要收集大量的衣片和成衣图像数据,并对这些数据进行标注,以便训练模型能够识别不同的质量问题和缺陷。这些数据可以来自生产过程中的实际拍摄,也可以从其他来源获取;使用标注好的数据来训练AI大模型。在训练过程中,模型会学习如何识别衣片和成衣中的各种质量问题,如污渍、破损、尺寸不符等。训练好的模型可以具有很高的准确性和可靠性;将训练好的模型部署到实际的生产环境中。
这可以通过将模型集成到现有的质量检测系统中,或者开发新的质量检测系统来实现。在生产线上,可以通过自动拍摄衣片和成衣的图像,然后将这些图像输入到模型中,模型会自动识别出其中的质量问题。我国“AI+制造”领军企业创新奇智的“奇智孔明AInnoGC工业大模型”和“AInnoGC工业大模型技术平台”可以为服装制造业衣片和成衣中的各种质量检测服务。



结束语


(1)在2024年3月5日发布的2024政府工作报告中,首次提出开展“人工智能+”行动。在当前由AI大模型驱动的新一轮人工智能热潮下,“人工智能+”行动的提出,是顺应潮流,重大利好。随着“人工智能+”行动的开展,政产学研用都将推进“人工智能+”在各行各业落地,经济社会将加速进入由人工智能驱动的AI大模型新时代。“人工智能+”的到来,将促进很多人工智能“新物种”的诞生,如AI Agent、人形机器人、无人驾驶汽车等等,这些将加速智能经济的快速发展壮大。时代的车轮滚滚向前,人工智能浪潮已势不可挡,我们制造企业只有积极拥抱它才能生存。


(2)我很赞同AI科学家贾扬清说的一段话,借来作为一个结束语,他说:“目前国产大模型中,主要分为三类:一是原创大模型;二是套壳国外的开源大模型;三是拼装大模型,也就是把过去的小模型们拼在一起,变成参数量看起来很大的“大模型”。其中,原创大模型数量最少,做原创大模型需要有很强的技术积累,且要有持续的高投入,风险很大,因为一旦模型没有足够强的竞争力,这些大规模投入就打了水漂。······到商业化落地阶段,客户也不太会在意是否原创,有用就行,甚至不少客户会因为成本更低,更愿意选择非原创的技术”。


(3)服装制造业要使AI大模型应用落地,一是要面向企业应用场景推进AI大模型技术攻关;二是要建立和收集规模化的大模型工业数据资源;三是要完善AI大模型在制造企业的应用性能评测机制;四是要选好和做好AI大模型应用企业试点示范工作。


2024年4月稿


图片

图片


首页

展位申请

免费参观