Slack直接上市的背后:对比分析,咬文嚼字

Laurent El Ghaoui 和 Serge Marquié

在Uber和Lyft之后,现在轮到Slack上市了。和任何申请公开上市的公司一样,Slack必须向SEC提交一份名为S1的特殊文件。S1文件旨在上市前, 向市场参与者提供有关公司结构,预计收入,客户获取,业务风险等信息。

S1备案通常是长文件(Slack案例中的221页),有很多财务和法律术语。有时,根据新事件,变更或美国证券交易委员会澄清请求,公司提交一个或多个修订版本,称为S1-A文件。以Slack为例,一套四个S1文件,一个原件和三个后续修订,总共889页:绝对称不上是典型的早餐读物。

图片来自Unsplash,Austin Distel

图片来自Unsplash,Austin Distel

市场对Slack十分有兴趣,因此有大量的新闻提供了对S1文档的分析。来自Crunchbase的这篇文章(注1) 很典型:在提供Slack的介绍之后,作者评论了S1文档中的预计收入等数字, 但未提及几个S1文件版本。因此,这些分析虽然有用,但却集中在S1文档中的一小部分,包含了一些表格与数据。

作为投资者,我们可能有兴趣评估与公司相关的各种风险; 我们还想了解哪些事件促使公司提交修改版本。为此,必须进一步,进入非结构化数据域,并分析文本本身。

在之前关于亚马逊和Facebook SEC的大量文档的研究中(注2),我们展示了如何使用大规模文本分析来快速发现与投资相关的信号。在这篇文章中,我们将重点介绍S1文件的不同版本的对比分析:这四个版本有何不同?基于这些差异,潜在投资者应该问什么问题?我们的重点是将最后一份文件(S1-A#3)与第一份文件(原始S1)进行对比。

主题对比分析是sumup.ai开发的一种新技术,可以快速对比两组文档。它会自动提取一些关键词和相应的句子,捕捉了两组之间的差异。对比关键字称为“对比主题”。我们可以提取多个“对比主题”,每个主题都揭示了两个语库之间差异。

以Slack这新旧两个版本文件为例,基本方法是,找出现在新文件(S1-A#3)但没有在原文件(原始S1)的词。作为结果,我们找到了89个“新词”,涉及329个“新句子”。


在S1文件(S1-A#3)的最后一个版本中出现的,但没有出现在第一个版本中的高频单词,按数量递减排列。 实际列表有89个“新词”。

使用这个的方法已经提供了一定的信息量:上面显示的高频新词揭示了几个有趣的主题, “循环”,“契约”和“借用” 。我们稍后将详细介绍。

在深入研究每个主题之前,我们注意到,简单的计数方法是有缺点的。首先,列表中的某些单词其实是不具有信息量的,例如“修正”, 该单词确实很好地描述了针对新文件(S1-A#3)与原文件(S1)的区别,但新文件(S1-A#3)存在的意义就是为了修正原始S1文档。另一个例子是“芝加哥”,它指的是原始S1档案中未提及的一个办公地点。这些术语是“误报(false positives)”,所以并没有带来新的信息。

其次,还有一些两个文件共有的词语,没有出现在上述“新词”列表,例如 “信用”这个词; 但是它们的上下文语境和周围语言可能会有很大不同,因此它应该包含在对比术语列表中。这个词也属于“误报(false negative)”。

我们的对比分析解决了以上误报和否定的问题。在下表中,我们展示了将每个版本与之前的版本进行对比的结果,从而产生一组“最有区别”的关键字。该工具还为每个这样的关键字选择代表性句子,以便解释其上下文的语境。


新文件(S1-A#3)与原文件(S1)的对比主题分析,每个关键字的相应典型句子。“循环信贷额度”这一术语出现在高频排序较前位置。其关键字2-4相对应的句子特别具有揭示性,提供了贷款的详细信息(“循环信贷工具”)。

如上图所示,第一个术语是“未经审计(unaudited)”,指的是公司自第一次提交申请以来尚未审计的新财务报表。该术语在原文件(S1)中出现9次,在新文件(S1-A#3)中出现38次。这提出了一个问题:为什么有这么多未经审计的文件?

第二组术语指出 “循环信贷(revolving credit)”作为新文件(S1-A#3)与原文件(S1)之间对比的重要主题,与我们的第一个简单的单词计数方法一致。显示的句子指向文档的特定页面,即新文件(S1-A#3)中的第38和87页,我们在其中了解到:

  • “因为我们的循环信贷工具,我们的贷款人有几乎所有资产的优先留置权,其中包含财务契约和对我们行为的其他限制,这可能会限制我们的运营灵活性,或对我们的经营业绩产生不利影响。”
  • “此外,循环信贷额度包含财务契约,包括最低流动性余额和最低收入金额。截至2019年5月30日,我们遵守了循环信贷额度下的所有契约。“
  • 循环信贷工具是一种相当有限的贷款类型,它为分析师提出了一些问题:

  • 为什么Slack必须进入这样的信贷工具?是因为公司需要某种过桥贷款(bridge loan),也许是因为他们不得不推迟原始日期的公开上市?
  • 为什么在最初的S1中这些条款中没有提到这笔贷款?
  • 截至2019年5月30日,Slack遵守契约,但他们在多大程度上违反了这些契约?
  • 参与贷款的金融机构对所有资产都有留置权; 直接上市的收益是用来偿还其中的一小部分吗?是否还必须首先满足其他契约?
  • 我们从这次分析中学到了什么?投资者通常在调查中需要进一步问一些问题, 借助sumup.ai开发的对比分析技术,投资者可以快速识别不同版本S1申请中的对比信息,从而产生有意义且有针对性的问题,这些问题可能对估值和投资决策产生直接潜在影响。

    资料来源:

    1)A First Look At Slack's S-1 Filing For Its Impending Direct Listing, Crunchbase News, https://news.crunchbase.com/news/a-first-look-at-slacks-s-1-filing-for-i...

    2) 有关亚马逊和Facebook SEC文件的研究:https://www.sumup.ai/#/webinars

    8 月 8 日 10:00 - 12:00

    赛灵思联手 SumUp 首席专家,共同为大家带来一场别开生面的网上研讨会,大家可以报名现场领略基于 Alveo 加速卡的文本信息是如何帮助您从浩如烟海的海量文本中分析和提取关键信息的。

    扫码报名即送“幸运大转盘”!!会员专享福利哦!!

    关于SumUp和Nucleus

    SumUp Analytics 的 Nucleus 平台是一个提供 Xilinx FPGA 支持的实时文本分析 SaaS 算法,用于从非结构化文本中识别、提取和分析重要信息。该平台在采用 Alveo™ U200 加速器卡的本地设备或 AWS EC2 F1 实例上无缝工作。Nucleus 不仅包括一个运行在 Xilinx FPGA 上的 Python/SDAccel 混合库,用于核心分析,而且还包括用于外设分析的分布式 CPU。

    关于 Alveo

    赛灵思 Alveo™ 数据中心加速器卡专为满足现代数据中心变幻莫测的需求而设计。对于常规工作负载,与 CPU 相比性能提升高达 90 倍,这其中包括机器学习推断、视频转码和数据库搜索与分析。

    最新文章

    最新文章