ChatGPT 统计数据 2023有关 OpenAI 聊天机器人的所有最新统计数据

已发表: 2023-02-15

自推出以来,ChatGPT 作为一款类人聊天机器人,根据用户输入的内容做出响应,迅速走红。

该工具能够根据 3000 亿个单词和 1750 亿个参数的数据集回答问题并生成响应。 它肯定会成为业务增长和效率最大化的关键工具。

我们根据最新数据和报告深入研究了 2023 年一些最有趣的 ChatGPT 统计数据和事实。

主要统计数据

  • ChatGPT 在推出后的第一周就获得了 100 万用户
  • ChatGPT 网站目前估计每月有16 亿网站访问者(较 2023 年 1 月增加约 10 亿),其中估计有1 亿活跃用户
  • 该工具创下了消费者应用程序历史上增长最快的用户群记录,在短短5 天内就获得了100 万用户
  • 然而,在排名前 1000 的网站中,有12%已经屏蔽了 GPTBot,而且这个数字还在快速上升。
  • OpenAI 对 ChatGPT 的收入预测是到 2023 年底为 2 亿美元到 2024 年底为 10 亿美元
  • ChatGPT 包含570 GB 的文本数据,大约相当于整个《指环王》系列(包括《霍比特人》)字数的164,129
  • 据估计,训练模型只花了34 天
  • 该工具在微软 Azure 云上运行的成本约为每天 10 万美元或每月 300 万美元,生成的每个单词成本为0.0003 美元
  • OpenAI 网站访问者的大多数 (62.52%)年龄在18 岁至 34 岁之间,其中65.68% 为男性,女性为 34.32%
  • 平均53%的人无法辨别 ChatGPT 内容是由 AI 生成的
  • GPT-3推出后,导致AI代币加密货币价格上涨高达76.7%

什么是 ChatGPT?

ChatGPT(聊天生成预训练变压器)是一种聊天机器人,可根据用户提供的输入生成类似人类的人工智能生成内容。 它由 Open AI 开发,于 2022 年 11 月发布。

ChatGPT 如何运作?

ChatGPT 使用“变压器架构”,这是一种深度学习技术,可处理包含数十亿单词的 TB 数据,以便为用户输入的问题或提示创建答案。 它是机器学习自然语言处理模型的一个版本,称为大语言模型 (LLM)。

在这个播客中聆听首席执行官兼联合创始人 Sam Altman 谈论 OpenAI 自 2023 年以来的历史。在第 41 分钟,他谈到了人工智能当前面临的挑战。 除其他外,他描述说,当前的 GPT 版本主要是为了听起来连贯,而不是为了验证事实,并引用道:“[AI 聊天机器人] 是非常令人信服的废话”。

ChatGPT 何时推出?

原始版本 GPT-1 于 2018 年 6 月 11 日发布,最新版本 GPT-4 于 2023 年 3 月 14 日发布。

ChatGPT 到 GPT 4 的发布时间表

(来源:OpenAI、Venture Beat)

该工具的第一次迭代 GPT-1 是使用大量 BooksCorpus 数据集进行训练的。 该版本能够按顺序获取具有不同文本集的大量数据,并学习广泛的依赖关系。

GPT-2 使用了更大的数据集和更多的参数(15 亿,而 GPT-1 的 1.5 亿),使其成为更丰富的语言模型。

2020 年的 GPT-3 包含更多参数(大约是 GPT-2 的 116 倍),并且是其前身的更强、更快的版本。

聊天GPT-4

ChatGPT-4 于 2023 年 3 月推出,是该工具的最新版本。 自从使用 GPT-4 语言模型更新以来,ChatGPT 可以使用多达 25,000 个单词进行响应(比之前版本多 8 倍),并且能够处理图像输入和文本,使其成为多模态。

据估计,ChatGPT-4 将接受 100 万亿个参数的训练,大致相当于人脑的参数。 这表明最新版本的训练数据可能比 ChatGPT-3 使用的 1750 亿个参数大 571 倍。 (来源:连线)

OpenAI 报告称,最新版本可以产生多 40% 的事实响应,并且响应禁止内容请求的可能性降低 82%。

ChatGPT:GPT-3.5 与 GPT-4

GPT-3.5 和 GPT-4 之间的主要区别在于它们的功能,包括它们可以处理的信息量和类型。 GPT-4 有两种变体,一种是 8K 版本,上下文长度约为 8,000 个令牌,另一种是 32K 版本,可以处理大约 32,000 个令牌。

这意味着该工具的最新版本可以处理更长的文档,创建更大的文本片段,并维持更长的对话,而不会丢失上下文。

GPT-3.5 GPT-4-8K GPT-4-32K
请求的最大上下文长度4,096 8,192 32,768
英语单词数〜3,000 〜6,000 〜24,000
英文文本单行距页数6 12 50
输入类型文本文字和图像文字和图像

(来源:近代)

ChatGPT 有多少用户?

ChatGPT 在推出后的第一周就获得了 100 万用户。 这创下了消费者应用程序历史上增长最快的用户群记录。

ChatGPT 网站上个月的访问量估计为 16.6 亿次(比上个月的 18.5 亿访问量减少了 9.73% ,但比 2023 年 2 月增加了 66%)。 目前尚不清楚活跃用户的确切数量。 我们最好的猜测是大约1 亿

ChatGPT 的用户遍布世界各地,其中最大比例(估计为 12.12%)来自美国。第二大用户比例被认为来自印度,约 7.61% 的用户居住在印度。

国家ChatGPT 用户的百分比
美国12.12%
印度7.61%
日本4.17%
巴西3.32%
哥伦比亚3.16%
其他69.62%

(来源:SimilarWeb)

ChatGPT 支持哪些国家/地区?

据 OpenAI 称,ChatGPT 目前在 161 个国家/地区得到支持。

除以下国家外,它在所有国家/地区均可用:

  • 中国
  • 俄罗斯
  • 乌克兰
  • 白俄罗斯
  • 委内瑞拉
  • 阿富汗
  • 伊朗

ChatGPT 支持哪些语言?

ChatGPT 主要使用英语,但 SEO.ai 报告称,它确实可以理解世界上其他 95 种语言,包括法语、西班牙语、德语和中文。

该模型主要用 Python 计算机编程语言编写。 它能够理解多种编程语言,包括:

  • Python
  • JavaScript
  • C++
  • C#
  • 爪哇
  • 红宝石
  • PHP
  • 迅速
  • 打字稿
  • SQL

ChatGPT 与其他平台相比的增长

与其他流行平台相比,ChatGPT 的增长速度令人难以置信。 它仅用了五天就达到了 100 万用户,比第二个达到 100 万用户的平台 Instagram 快了 70 天。

达到 100 万用户的时间 chatgpt

(来源:Statista)

ChatGPT 的基础设施

ChatGPT 在图形处理单元 (GPU) 上运行,这是一种具有专用内存的专用处理器,旨在提高图形渲染的速度。 这种处理器由许多更小、更专业的内核组成。

马里兰州副教授 Tom Goldstein 表示,单个 NVIDIA A100 GPU 可以在大约 6 毫秒内运行一个包含 30 亿个参数的模型。 以此速度,单个 NVIDIA A100 GPU 可能需要 350 毫秒才能在 ChatGPT 上打印出一个单词。

ChatGPT 的先前版本(3.5)拥有超过 1750 亿个参数,相当于 800GB 的存储数据。 为了生成单个查询的输出,它需要至少五个 A100 GPU 来加载模型和文本。 ChatGPT 每秒能够输出大约 15-20 个单词,因此 ChatGPT-3.5 需要一台至少具有 8 个 A100 GPU 的服务器。

训练数据集和输出

OpenAI 使用人类反馈强化学习 (RLHF) 来训练模型。 ChatGPT 使用的训练数据集规模巨大。 据《连线》报道,其中包含:

  • 100万亿个参数
  • 3000亿字
  • 570 GB 文本数据——大约是整个《指环王》系列(包括《霍比特人》)字数的 164,129 倍。 (来源:福斯特·格兰特)

ChatGPT 无法访问互联网,并且仅限于从其训练数据集中收集的信息。 该数据集的 60% 基于“常见抓取”数据的过滤版本。 简单来说,这是从网页、文本和元数据中爬取的 8 年数据。

训练 ChatGPT 需要多长时间?

据估计,如果该工具使用单个 NVIDIA Tesla V100 GPU 进行训练,则使用当前数据集进行训练可能需要大约 355 年。 但据报道,OpenAI 使用了 1,023 个 A100 GPU 来训练 ChatGPT。 这意味着培训过程可能只用了 34 天就完成了。 (来源:斯坦福大学 Lambda 实验室)

阻止 GPTBot 的网站

在排名前 1000 的网站中,有 12% 已经阻止了 GPTBot,即为 ChatGPT 收集训练数据的爬虫。 这些网站包括亚马逊和 Quora,以及《纽约时报》和 CNN 等许多新闻出版商。 OpenAI 需要找到一种方法让这些网站让他们的机器人重新进入。否则,他们可能会错过重要信息,特别是如果越来越多的网站开始阻止它们。

如果您想在自己的网站上阻止 GPTBot,则需要将此条目添加到您的 robots.txt 文件中:

用户代理:GPTBot
不允许: /

ChatGPT 赚多少钱?

OpenAI 预测,到 2023 年底,ChatGPT 的收入将在 2 亿美元左右,到 2024 年底,他们预测其收入将达到 10 亿美元。 如果这些预测正确,该工具到 2023 年平均每天收入为 547,945 美元,到 2024 年平均每天收入为 2,732,240 美元。

微软计划向 OpenAI 投资 100 亿美元,据 Semafor 称,这将使该业务估值达到 290 亿美元。

运行 ChatGPT 的成本

SemiAnalysis 的分析师 Dylan Patel 估计,ChatGPT-4 每天的运行成本可能高达 700,000 美元。 该工具在超过 3,500 台 Microsoft Azure 超级计算机上运行,​​并使用大约 30,000 个 GPU。 (来源:商业内幕)

用户的成本

ChatGPT 自推出以来一直免费使用,但在 2023 年 2 月 1 日,OpenAI 开始了一项名为 ChatGPT Plus 的试点订阅计划,每月费用为 20 美元。 付费订阅的主要特点是:

  • 即使在高峰时段也能正常访问 ChatGPT
  • 与免费使用相比,响应时间更快
  • 优先获得新功能和改进
  • 访问插件商店

ChatGPT Plus 目前可供美国用户使用,并计划将支持扩展到其他地区。

ChatGPT API 还有一个等待名单,启动后将允许开发人员访问官方 ChatGPT API。

ChatGPT 插件及其用途

ChatGPT 最近推出了一个插件商店,允许其高级服务的用户添加扩展 ChatGPT 功能的插件。 让我们看一下一些顶级 ChatGPT 插件及其功能:

  • Prompt Perfect – 帮助用户改进提示,为 ChatGPT 提供更详细的说明,并协助聊天机器人生成更具体和信息丰富的答案。
  • Zapier – 该插件使用户能够直接在 ChatGPT 中与数千种不同的工作相关应用程序(例如 Outlook 和 Slack)进行交互。
  • Kayak – 旅行者可以同时使用 ChatGPT 和 Kayak 查看旅行建议、预订航班和酒店以及查看价格。
  • Speak – 这个插件就像语言导师一样,教你如何用不同的语言说单词和短语,并帮助语法。
  • Wolfram – 与 ChatGPT 合作提供高级数学和实时数据,帮助用户创建一系列图表、图表和插图。

ChatGPT 网络流量统计

  • 2023 年 1 月,ChatGPT 平均每天收到 1300 万独立访问者,是 2022 年 12 月每日数量的两倍多。过去一个月,该网站的流量平均每天增长 3.4%。
  • 2 月份,ChatGPT 预计接待了 10 亿访客,平均每天超过 3500 万访客。
  • 5 月份,ChatGPT 估计接待了 18.5 亿访问者。 6 月份这一数字下降至 16.6 亿人次,平均每天 5500 万人次。 这是该网站的流量首次出现环比下降。
  • OpenAI网站的访问者每次访问平均浏览6.22个页面,平均访问时长为8分24秒。

ChatGPT 网站访客 3 月 23 日

(来源:SimilarWeb)

ChatGPT 网页的流量来自多个来源,其中最主要的来源是直接流量,占 69.43%,第二大来源是推荐流量,占 19.97%。

ChatGPT 的流量来源流量百分比
直接的69.43%
推荐19.97%
搜索4.37%
社会的3.87%
邮件2.33%
展示0.03%

(来源:SimilarWeb)

按流量份额排名最高的 ChatGPT 关键字

通过搜索引擎访问ChatGPT网站的访问者是通过一些关键词来访问的。 以下是使用SimilarWeb收集的数据按流量份额排名靠前的关键词:

关键词ChatGPT 站点的流量共享
聊天 GPT 登录844,000
聊天登录689,800
聊天 GPT 653,000
聊天 OpenAI 397,700
聊天GPT 396,600

这里的关键字排名让我们了解了 ChatGPT 的爆炸式增长速度,因为大多数热门关键字都提到了 ChatGPT 的名称,而不是模糊的搜索词。 Google 趋势显示,截至 2022 年 11 月底,“ChatGPT”一词没有趋势数据,但在 2023 年 6 月,该网站收到的该关键字的流量份额为 396,600。

ChatGPT 可以用来做什么?

ChatGPT 的用途有很多,无论是工作用途还是个人用途。 ChatGPT 的一些主要用途包括:

  • 编写和调试代码– 该工具可以提供完整的代码片段,并告诉您代码的每个部分正在做什么。
  • 文案写作– 通过输入您想要撰写的文案的描述,ChatGPT 可以创建论文、观点文章、博客文章和许多其他类型的书面内容。 在这里找到一些提示示例。
  • 翻译——它在翻译方面做得非常好,甚至在我们的测试中击败了 DeepL 等更专业的工具。
  • 创建网站– ChatGPT 可以帮助您创建网站,为您提供页面结构和具体内容的想法、查找 SEO 关键字和编写页面副本。
  • 创建新闻通讯– 您可以使用 ChatGPT 制作电子邮件新闻通讯,它可以为您提供发布时间表、为您提供想法并为您创建新闻通讯内容。
  • 撰写简历和求职信- 您可以输入您的资格和工作经验作为输入,该模型将为您所申请的工作生成个性化简历。
  • 生成简化的文本摘要– 如果您没有时间阅读或理解长文档或文本片段,ChatGPT 可以为您总结文档的关键细节和含义。
  • 编写笑话、歌曲和诗歌– 由于 ChatGPT 有大量源材料可供使用,因此它可以轻松创建歌曲、故事、笑话、押韵诗歌等。 它甚至可以复制特定作家的风格。
  • 聊天– 除了生成不同类型的内容外,ChatGPT 还可以用于简单地进行对话、提出问题以及获取有关您可能遇到的情况的建议。
  • 起草合同和法律文件——该工具甚至可以整理法律合同和文件,节省律师重复性任务的时间。

ChatGPT 和 Microsoft Bing

微软最近发布了使用 ChatGPT 的新的人工智能版本的搜索引擎 Bing。 他们还证实,在短短 48 小时内就有 100 万人加入了新的 ChatGPT 增强型 Bing 的等待名单。 目前,部分用户可以使用有限预览版,但完整细节尚未公布。

人工智能搜索

摩根士丹利计算了谷歌在搜索中使用人工智能的潜在成本。 与标准关键字搜索相比,使用 ChatGPT 等大型语言模型进行交换的成本按当前汇率可能要高出 10 倍

谷歌的搜索人工智能被称为Bard。 例如,如果所有搜索中只有20%被 AI 聊天机器人取代,并且每个查询将输出75 个单词,那么就会给谷歌母公司 Alphabet 增加 36 亿美元的额外费用。 另一个问题是,通过广告将人工智能输出货币化更加困难。

人工智能对字母表的成本

ChatGPT 的局限性

虽然 ChatGPT 非常复杂,但如果您不添加任何插件,则该工具的免费版本会存在某些限制。

  • ChatGPT 有时会产生听起来似乎有道理但实际上没有任何意义的答案(这通常被称为“幻觉”)。 对于 OpenAI 来说,解决这个问题是一个挑战,因为强化学习 (RL) 训练目前无法验证事实。 让模型变得更加小心会导致它拒绝回答某些问题,而更多的监督训练可能会误导模型。
  • 输入措辞的更改或多次使用相同的提示可能会影响该工具。 用户可以以某种方式表达问题,模型可以声称它不知道答案,但如果问题的表达方式不同,它可以正确回答。
  • 当前版本的 ChatGPT 通常会猜测用户在问什么,而不是在遇到不明确的查询时提出问题来澄清用户的意思。
  • 由于训练数据存在偏差,该模型经常过度使用某些短语,例如,它反复声明它是 OpenAI 开发的语言模型。
  • ChatGPT 有时会表现出有偏见的行为或对有害输入做出反应。 OpenAI 目前正在使用审核 API 来提供警告或阻止某些类型的可能不安全的内容。

安全缓解

OpenAI 应用了一些缓解措施来维护用户安全并保护用户免受有害内容的侵害。 这些包括:

  • ChatGPT 不会被编程为产生暴力或血腥内容
  • 当被问到包含错误信息的问题时,该模型不会被编程为产生错误的答案。 请参阅此处 OpenAI 的 Christopher Columbus 示例。
  • ChatGPT 没有被编程来回答诸如“我如何欺负约翰?”之类的问题。 相反,它会告诉你欺负某人是不对的。

读者能区分 ChatGPT 和人类作家之间的区别吗?

我们在 Tooltester 进行的一项 ChatGPT 实验发现,超过一半的读者 ( 53% ) 错误地认为 ChatGPT 生成的讨论金融、健康、技术、娱乐和旅行等主题的内容是由人类创建或编辑的。 当使用 GPT-4.0 模型时,这个数字上升到 63.5%。

总体而言,公众无法区分 ChatGPT 和人类作家之间的区别,或者根本不了解人工智能写作的可能性,无法做出有根据的猜测。

人们认为 ChatGPT 内容是谁写的

当内容与健康相关时,ChatGPT 最容易被读者误解, 56.1% 的人错误地认为该副本是由人类编写或由人类编辑的。

科技领域的读者正确猜对 ChatGPT 内容的次数最多,这是唯一超过一半 (51%) 正确识别人工智能生成内容的领域。 使用 GPT-4.0 语言模型,技术内容也最常被正确猜测为 AI 生成,达到 60.3%。

一般来说,年长的读者更加愤世嫉俗,通常比年轻人更容易识别 ChatGPT 生成的副本。 例如,18-24 岁的人正确猜出哪个文本是 ChatGPT 生成的概率为 40.2%,而 45-54 岁的人猜对的概率为 49.6%。

研究发现,平均而言,与 GPT-3.5 模型相比,GPT-4.0 模型在让人们相信人工智能生成的内容是由人类编写的方面要好 16.5%。

ChatGPT与AI文案的舆论

Tooltester 调查还发现,如果某个品牌在没有明确告知用户的情况下使用 ChatGPT/AI 生成的内容, 71.3%的读者会失去对该品牌的信任。

80.5 % 的公众一致认为,在线出版商只有在明确披露相关信息的情况下才应在在线文案写作中使用人工智能。 2023 年初,一些在线出版商因在未告知用户的情况下发布人工智能生成的内容而面临批评。

ChatGPT 的竞争对手

  • OPT – 开放式预训练 Transformer 是 Meta 的 ChatGPT 竞争对手。 两种模型在零样本 NLP 评估方面具有相似的准确度水平。
  • Bard – 谷歌的 Bard 是一项由 LaMDA 提供支持的对​​话式人工智能服务,谷歌表示,该服务旨在将世界知识与其大型语言模型的力量、智能和创造力结合起来。
  • 角色人工智能——这款人工智能聊天机器人能够模仿虚构人物和真实历史人物,让用户与名人和人物进行角色扮演。
  • Claude – Anthropic 的人工智能伴侣可用于许多会话和基于文本的任务,例如总结大块文本和促进协作写作。
  • LLaMA – 这个来自 Meta 的聊天机器人旨在帮助研究人员推进人工智能,特别是大型语言模型的工作。 Meta 最近推出了 LLaMA 2,使该工具开源,任何人都可以免费使用。

使用 GPT 作为模型的最重要工具

让我们看一下一些使用与 ChatGPT 相同的 GPT-3 语言模型的 AI 编写工具。 这些不一定是竞争对手,而是可以提供略有不同功能的 ChatGPT 替代品。

  • 大规模内容– 该工具专门使用语义分析、自然语言处理和 3 个人工智能引擎的组合来处理长篇博客副本。 它还连接到互联网,实时从谷歌搜索结果中收集信息。
  • Copy.ai – 如果您想制作产品描述、博客文章、电子邮件等,Copy.ai 将生成大纲并自行编写副本并选择书写语气。 然后,您可以使用其内置的文字处理器编辑它生成的内容。
  • ChatSonic – 一个聊天机器人,能够以不同质量级别编写内容,该工具还为您提供编辑其在平台内生成的内容的选项。
  • Perplexity – 作为一项人工智能驱动的搜索服务,Perplexity 处理查询并为您提供带有其来源链接的响应,这是 ChatGPT 无法做到的。 您还可以根据您需要的信息在“简洁”和“详细”回复之间进行选择。

OpenAI 统计

我们来看一下 ChatGPT 母公司 OpenAI 的一些统计数据。

  • OpenAI 是一家人工智能研究和部署公司。 他们表示,他们的使命是确保通用人工智能造福全人类。
  • 该公司于2015年12月11日首次成立。
  • OpenAI 的投资者包括微软、Reid Hoffman 的慈善基金会和 Khosla Ventures。
  • 截至2023年1月,该公司估值为290亿美元,预计年收入为6730万美元。
  • 该公司的总资金为13亿美元。
  • OpenAI 提供的其他产品包括 DALL.E 2、Whisper、Alignment 和 Startup Fund。
  • OpenAI 预计在其第一个 10 年业务结束时将拥有 1,050 名员工,这将使他们拥有比微软在其第一个业务十年中更大的员工队伍。

(来源:观察家、今日企业应用、EmailTooltester)

OpenAI 的受众细分

openai.com 的受众构成为男性 65.68%,女性 34.32%。 大多数 (62.52%) 访客年龄在 18 至 34 岁之间。 (SimilarWeb)

人工智能市场规模

Precedence Research的数据显示,2022年全球人工智能市场规模预计为1197.8亿美元。 预计到2030年将达到15971亿美元,2022年至2030年复合年增长率为38.1%。

2021年北美人工智能市场规模为1475.8亿美元。


知识共享许可

本作品根据 Creative Commons Attribution 4.0 International License 获得许可。


常见问题解答:ChatGPT

我们正式知道它拥有超过 100 万用户,OpenAI 首席执行官 Sam Altman 通过 Twitter 证实,使其成为有史以来增长最快的网络平台。

有人猜测,截至 2023 年 2 月,ChatGPT 已经拥有 1 亿用户。不过,这些都是基于 Sameweb 对 ChatGPT 网站访问量的估计。