游客的目的地感知是如何形成的？——基于文本挖掘的探索性研究

史达张冰超衣博文

2022-06-10

来源：旅游学刊

［摘要］游客感知是旅游目的地管理的重要研究领域。以往研究多基于扎根理论对素材进行人工编码并归纳出范畴，或以对中介变量的假设检验来讨论其形成机制。文章以大连市5家著名景区的10万余条游客评论为资料来源，首先根据游客评分，对评论文本进行正负情感维度划分；然后以TF-IDF 和TextRank两种算法对景区游客文本评论抽取关键词，并遵循诠释性研究的范式，提炼出游客正负感知的子范畴和关键范畴；随后，利用LDA主题模型方法测算出上述游客正负感知范畴的权重次序。在此基础上，最终梳理出游客目的地感知形成过程的故事线。研究结果表明：（1）游客感知的表征因素、效用因素、结构因素和特征因素等范畴内蕴含着复杂的正负情感双重维度，并呈现出动态演变的特征。（2）游客感知范畴内的正负情感主题具有显著的差异性。（3）游客正负感知之间的转换和调整，动态演绎出游客对目的地的最终认知与情感。文章建构了游客的目的地感知形成的动态过程，拓展了情感细粒度在游客感知理论的深度，同时拓宽了游客感知理论研究方法的边界。

引言

游客感知作为研究旅游者心理和行为的起点，是游客感觉和知觉的综合体，通过多感官体验目的地旅游资源、旅游环境等信息所获得的心理认知过程 [3]，也是游客将外部的目的地旅游信息转换为内在思维的过程 [4]。由此可见，游客感知是一个过程，并建立在旅游者与目的地的关联和互动的基础之上。那么，这个过程是如何演化的呢？游客感知从始至终总是“爱”或“憎”吗？一个给出高分评价（结果）的游客，就没有“不开心”的时刻吗？Court 和Lupton指出，游客感知的形成和变化在于旅游者对目的地旅游信息内容的处理方式 [5]。一方面，目的地作为信息源具有无偏性；另一方面，旅游者对于目的地旅游信息的接收和处理具有差异性和能动性，进而导致各异且变化的游客感知的形成。因而，对游客感知形成过程的研究就要求充分考虑到旅游者体验的动态性及其情感态度之差异性。

现有对游客感知形成机制的相关研究，多采用基于深度访谈的扎根理论、民族志等定性方法。扎根理论作为质性研究的重要方式，主要是对访谈资料的编码以及概念的梳理和范畴的提炼。这些访谈资料通常是连续性、较长篇幅的，而对片段化的资料通常不予考虑。经验性的观察发现，大量游客评论事实上均是“只言片语”，而非整理规范的“旅游攻略”。这些碎片化的评论，可能反映了游客在旅游体验过程中的动态情感变化，但通常都被过滤处理 [6]。对于完整形态的长篇幅旅游攻略，除了可能是业内知悉的“水军软文”之外，这些长评论集中反映了那些愿意发表观点的旅游者的看法。从统计学的角度看，其代表性存在着内生性的偏差。

依循“在原始资料的基础上发现问题，并探寻问题的解决方法”的质性研究范式，在海量原始碎片资料的整理和阅读环节，借助成熟的计算机文本挖掘算法，辅助研究者进行质性编码，既突出机器算法处理大数据的特点，又充分发挥质性研究在资料观察和深入思考方面的优势 [7]。在质性研究中，研究者的知识性和智能性为两个不可或缺的前提条件。鉴于数据处理技术已经在围棋、作曲、现代诗创作等对“智人”要求极高的领域的成功应用，数据挖掘方法应当胜任“文本”这类相对比较简单的数据处理对象。其实，质性研究的工具近几年也开始较多采用ROST、Leximancer 等语义分析软件对互联网文本进行分析，这已经显示出研究者在研究方法上寻求外延和拓展 [8]。但是由于ROST 算法是固化的，通常只是对词频进行描述性统计，高频词普遍集中在地名或者景点名并以静态结果为主，淡化了游客感知的关键词汇和情感变化，可能导致研究结论偏差 [9]。而TF-IDF ①TF-IDF（term frequency-inverse document frequency）是一种主要用于文本挖掘的常用加权算法，TF(term frequency)指词频，IDF(inverse document frequency)指逆向文本频率。此类成熟的算法能很好地挖掘出游客真实感知的统计特征，深入分析游客感知体验结果的情感细粒度 [10]。而且这些算法及其优化版可以在多个编程软件中被随时调用，非常便于非计算机专业人士使用。

对于“游客感知形成过程”的定量研究而言，通常借助中介变量的方式来发现哪些因素影响了游客感知的形成过程 [11-12]。这些数量较少的定量研究，虽然局部揭示了某些因素在游客感知形成过程中扮演的角色，但并未全画面展示游客感知形成过程的动态性，尤其是游客感知蕴含的多维度的复杂情感。另外，这些研究主要采用问卷调查数据。这类数据获取方式存在数据样本量小、调查成本高、问项有限等问题，致使研究结论存在一定的局部性和主观色彩 [13]。传统的问卷调查方式也无法细致深入探讨游客感知内部的情感细粒度问题。

1 相关研究进展1.1 游客感知及形成过程研究

国内外学界多以旅游体验价值来界定旅游感知的内涵。郭安禧等以实体价值、经济价值和学习价值3 个维度构建游客的感知价值 [14]。同样地，Choi和Choi以韩国为研究区域，研究旅游体验价值对目的地认知和情感的影响 [15]。再者，Qiu 等通过游客对非物质文化遗产的感知，以此建构对于旅游目的地的整体看法和态度 [16]。更具体地，Shao等 [17]、Gretzel和De Mendonca [18]通过研究旅游目的地品牌的视觉和言语标识等符号，指出游客对符号标识的解读进一步影响到游客感知目的地品牌的过程。

在上述探讨游客感知内涵的基础上，国内外相关文献也对游客感知所表征的现象、内容进行了较为系统的研究，相关研究主要集中在影响因素和感知过程两个领域。其中，已有影响因素的研究大多聚焦于旅游者和目的地层面。在旅游者层面主要是个体特征 [19]、兴趣偏好 [20]、旅游动机 [21]和媒体宣传 [22]等方面对旅游者决策的影响。在目的地层面的研究主要体现在目的地特征 [9]、旅游环境 [23-24]、服务与管理 [25]、旅游资源 [26]等方面，认为游客感知是旅游者与目的地关联和互动之中生成的对于目的地的认识和看法，是旅游者对于目的地情感态度的一种反映 [27]。游客与目的地关联与互动的过程就是具有个体特征的游客建构目的地认知和情感的过程，主要是目的地的信息性、互动性、个性化属性对游客的满足 [28]。简言之，这些研究的成果丰富，方法规范，场景全面，普适性强，因此这些重要的研究结论被用于支撑本文后续的故事线梳理和理论提炼。

在为数不多的对游客感知形成过程的研究中，从研究方法的视角观察，可较清晰地分为定性和定量研究两类。其中，定性研究方法主要以扎根理论为主。早期多以单一的实地访谈资料或者问卷为主，如高军等通过12个入境城市的623句问答的外国游客负面感知的单一访谈材料编码提炼出7大范畴和22 个小范畴，构建入境游客负面感知过程 [29]。熊伟和胡洋采用问卷的方式，探讨游客对非营利理念的感知过程 [30]。此后，扎根研究逐渐开始采纳网络文本资料，并将访谈资料和网络文本结合使用，如高楠等利用103 篇访谈和4707 条网络点评探讨旅游意象感知过程，归纳总结出13 个感知范畴 [31]。张红梅等结合实地访谈资料和网络文本等多资料源，通过扎根方法提炼归纳出7个游客感知范畴 [32]。此外，也越来越常见质性研究仅采用网络文本信息，如白丹等通过采集携程网评论3480 条和大众点评网2145条游客点评，利用扎根方法归纳出5个主范畴和32个范畴，建构遗产目的地的游客感知评价过程体系 [33]。王君怡等以26篇网络长游记文本为资料来源，采用扎根理论的方法提炼出8个主要范畴和19个对应范畴，探讨目的地旅游形象的认知过程 [34]。上述研究尽管涉及了游客感知过程，但仍在于提炼游客感知范畴，感知过程通常并非研究的重点。此外，研究资料尽管已经较为广泛地结合多种素材，但在编码后主要体现的仍是游客感知的静态结果，对于游客感知动态过程的研究依然少见，对于游客感知情感差异性的研究仍显不足。

总之，对于游客感知过程的研究，无论是定性还是定量研究，均集中在游客感知范畴的提炼归纳。在资料来源上，虽都开始采用网络评论，但处理方法仍延续常用的方式。因此，现有研究对于实际场景中的正负情感交互调整的动态过程审视不足，对于情感特征分析的细粒度仍较为粗略，对于游客感知的内在形成机制的变化性还关注不够。基于此，本文拟采用文本挖掘方法辅助诠释范式分析，基于海量信息提炼和归纳游客感知的关键因素，并重点关注游客感知过程的情感变化。

1.2 旅游文本分析技术

旅游者通过社交媒体或者在线网站生成的文本数据在旅游领域的应用逐渐上升 [41-42]。就文本分析方法出现的时间顺序而言，大致包括人工编码、ROST语义分析、文本挖掘算法等3种方式。人工编码仍是重要的文本分析方式，也不可能完全被机器编码所替代。同时，鉴于游客文本信息的海量化，研究者已经开始较为频繁地采用ROST语义分析工具，实现高频词处理和语义网络图。虽然ROST 软件一定程度上避免了研究者的主观因素和预设想法，但存在较严重的效度问题 [43]。ROST 语义分析以关键词、主客观词语为参考或者根据词典进行词频统计，常造成专属名词和常用词语的词频过高，未能深度挖掘出评论主题，比较容易忽略评论中有用的信息，增加了后续分析的误差。比如在对北京故宫的文本研究中，出现词频最高的是“故宫”和“北京” [8]。而实际上，这两个高词频可能并非游客的关注点，只不过在评论过程中，需要多次强调两个地理位置而已，游客真正关心的可能是“雪景”或“留念”。类似地，在天门山景区的游客情感特征研究中，词频最高的是“天门山”和“景区” [9]，可能导致本应是网络关联中心词的“游览”或“索道”被弱化，由此造成研究结论可能出现偏差。那些本应被突出的关键因素由于算法的原因极易成为研究盲点。

1.3 游客感知的情感维度

旅游者情感的维度构成在旅游者情感体验中占据极为重要的位置 [49]。探析游客感知体验情感维度的研究多通过访谈、问卷等方式，针对旅游者对目的地主客观事物的情感评价结果，集中探讨测度游客感知的积极或者消极情感维度 [50]。例如，Hosany 和Gilbert 的研究指出旅游者的目的地感知情感主要由快乐、爱、惊喜3个维度构成 [51]。黄潇婷研究开发设计“痛苦-快乐”情感维度的问卷量表来测度旅游者的情感体验 [52]。随着学者们对游客感知体验中情感维度的分析不断深耕，越来越多的学者开始关注旅游者情感的粗粒度和细粒度。粗粒度情感一般用于判断文本整体的情感极性；细粒度情感多被用于判断游客对评论对象中具体属性或维度的情感 [53]。情感细致化研究逐渐在旅游感知体验中占据重要地位。如Nawijn 等探讨黑色旅游情境中以痛苦、同情和积极为代表的旅游者情感维度，并解析出痛苦情感维度包含5 种负向情绪，积极情感维度包含4 种正向情绪，同情情感维度则介于正负向情绪之间 [54]。国内学者李君轶等则以8类积极情感、8类消极情感和4类中性情感构建旅游者情感轮，进一步细化旅游者情感维度，比较全面理解游客的情感体验 [55]。上述研究多通过研究者对旅游者的访谈或问卷资料进行归纳演绎，解读出旅游者的情感倾向和特征。

随着计算机技术在旅游者情感细粒度研究中的深入应用，通过“贴情感标签”来区分旅游者情感维度，成为深入研究旅游者情感体验差异的常用方式。例如李春晓等将游客评论数据事先贴上正负向情感两类标签，然后分别挖掘游客正负面情感体验的关键因素和情感特征差异 [13]。与之类似，Liu等通过中国游客对澳大利亚目的地的在线评价，以情感词典的方式为旅游者“贴情感标签”，据此探讨中国游客的情感画像以及与国际游客的情感特征差异 [43]。“贴情感标签”实际上是借助大数据技术探究旅游者感知体验的情感维度，有利于呈现出旅游者正负面情感的细粒度和动态变化 [56]。同时，基于大数据技术探讨游客感知的情感维度有利于深入理解旅游者的行为特征和表达倾向，在很大程度上刻画出旅游者的内在心理机制，是对旅游体验的深入剖析 [49]。本文拟在“贴情感标签”的基础上，进一步关注情感的变化。因为如果仅从旅游体验结果上看，旅游者似乎总是“爱憎不变”，始终处于某种情感的稳态，而这与惯常的旅游体验中情感变化的丰富性并不一致。因此，本文拟注重游客情感维度的差异化，并以此为基础，关注旅游者“爱憎”转换的动态情感过程。

2 研究设计与实施2.1 数据收集说明

携程网与去哪儿网拥有用户数量超过1 亿，具有海量的游客评论数据。两个平台均采用5分制的评级打分机制，评价层级分明。因此，本文将其作为游客感知数据来源平台。同时，选择大连市作为研究区域，主要是因为大连是我国著名的旅游城市，游客体验评论数据丰富，原始资料的代表性好，易于形成普适性较强的研究结论。目的地选取了大连市评论数量最多且百度指数关注度最高的5个著名景区，分别是金石滩风景区、老虎滩海洋公园、棒棰岛风景区、星海广场、圣亚海洋世界。再者，考虑到游客感知的时效性和建模所需的原始材料数量，本次数据选取2018年1月至2020年1月的游客评论文本。剔除掉无用和杂乱的评论信息，总共收集到用于文本挖掘的游客评论文本174 667条。

从原始材料的信度看，游客在线评论信息可被视为具有独立意义的文本内容，是游客真实感知的表达，具有良好的内在信度 [57]。从原始材料的饱和性要求看，在整理分析资料的过程中，本文不断反省已有资料是否存在缺陷或者不足。本文在初期仅收集了携程网的数据，鉴于目的性抽样的逻辑在于选择信息丰富的案例来进行深度研究，研究者从中可以获得很多对研究目的至关重要的信息 [58]。后又补充收集了与携程网打分机制类似，但用户群体不同的去哪儿网数据。最后通过对2018—2020年相关评论的随机浏览以及长篇幅评论的重点阅读，认为新的素材已不再提供新的信息，原始材料达到饱和。

为保证研究的效度，研究团队发现游客评论信息与研究者基于经验性的预判基本一致。同时本文采用了三角互证法。三角互证法要求采访者从不同的视角，让不同的受访者去分析评价同一现象或问题，他们观点之间的一致性和差异性对研究的结果都极为重要。本研究从游客（当地和外地）、景区管理者两个方面来搜集关于游客感知问题的观点。由于研究团队已经与当地景区管理者建立起了信任关系，因此获取了较全面和真实的信息。同时，研究团队在2020年9月中旬至10月中旬在上述5 处景点，与游客进行非正式访谈，获取相关信息。经比较两方对该问题的看法，发现与网络评论文本信息一致，网络文本信息可靠有效。

2.2 数据初步处理

（1）数据分析步骤说明

本研究遵循质性研究的规范并结合网络评论文本的特点，按照如下步骤开展研究：首先，对文本进行提纯，以获得合格的文本数据；其次，对游客评论文本先贴上“情感标签”，划分正负面的游客情感评论，以此区分游客的感知状态；然后，进行研究一，利用文本挖掘方法进行关键词提取，该项工作类同于开放式编码；接着，研究者通过诠释性研究来理解关键词阐发的意义，再对这些关键词进行子范畴归类，并总结出范畴。子范畴与范畴的提炼均由研究者人工进行。研究一虽然归纳出关键词，但并不知道其重要性的差异。在大多数研究中，通常将开放式编码默认为权重相等。已有一些研究通过人工统计的方式，计算子范畴在某文本中的比例 [59]，但仍未能获得各编码相互间的重要程度。故研究二以研究一所梳理出的4 个范畴为基础，进一步呈现出游客正负两种感知情绪中各关键词（编码）的重要性区别。此外，研究二的另一个作用在于，通过更换算法再次验证研究一的关键词提取是否准确。最后，在上述研究的基础上，研究三梳理出游客感知形成过程的故事线。

（2）数据提纯

由于通过网络爬虫收集的游客评论文本不可以直接使用，故处理文本信息之前首先对文本作中文匹配，只保留游客评论的文字部分。其次，进行数据去重，删除游客评论中部分重复的文本，提高文本分析效率。再次，删除缺失数据。收集的游客评论的完整文本理应包括游客昵称、游客评分、游客评价、评价时间4个维度，但是实际上对于每条游客评论文本可能存在维度不全的情况，导致部分游客评论无效失真等问题，影响到文本的信度和效度。此外，游客评论内容中字数特短的语句，可能无法正确表达出游客的真实感受，也比较难提炼出有效的特征项和关键词。借鉴赵宇晴等的经验，删除少于或等于4 个字的评论文本 [60]。最后，去除无效文本。游客评论文本包含大量并没有实际意义的停用词和特殊名词，如“的”“了”等。这些无效文本会降低文本挖掘的准确性，属于文本分析中的“噪音”。

（3）数据标签

本部分对游客评论文本“贴情感标签”。从游客的打分结果看，各分值分布不均衡，1 分和2 分的评论数比较少。因此，为提高游客评论文本的平衡性，本文借鉴李春晓等的方法 [13]，采用合并少数的方法将游客评分为1 分和2 分的划分为负面情感数据，将评分是5 分的划分为正面情感数据，将评分3分和4 分的划分为灰色数据，其中灰色数据是指好坏参半的游客评论，游客感知的情感差异区分度不高，由此删除灰色数据。具体分布见表1。

由表1可知，5个目的地景区的游客评分的均值和标准差均比较稳定，说明游客评论信息能够较好反映出游客感知的基本结构与内容。此外，在5 个目的地景区的正负情感数据与灰色数据的数量占比上，星海广场的正向情感的感知占比最高，表明游客认可程度较高。棒棰岛风景区的负向情感的感知占比最高，表明游客对棒棰岛风景区的感知体验相对其他景区较低。

表1 游客评论文本情况

Tab.1 Text comments of tourists regarding scenic spots

2.3 数据阐释框架

内容分析法不适合解读文本挖掘算法得出的关键词，因此，借鉴诠释性研究范式 [61-63]，通过研究者的浸入，对游客正负面感知的关键词和关键短语进行阅读与理解，有助于明确上述关键词在一个更一般性的语境中所能阐发的意义。由于国内外研究多基于“途径-目的”理论 [64-68]范式对游客感知进行归类，故本文依据该理论对机器编码结果进行梳理和诠释。“途径-目的”理论多从“属性-结果-价值”的链条，强调目的地产品或服务属性与游客价值之间的关系，将目的地属性视为达到目的的方法，反映出游客价值趋向。而游客体验结果作为目的地属性与游客价值之间的桥梁，将游客对目的地属性的体验结果与游客价值联结起来 [64]。具体而言，属性层是旅游目的地的产品或服务；结果层描述出游客通过目的地产品或服务属性产生的体验结果；价值层刻画出游客个人价值观和理性状态 [65]。对于旅游者来说，游客价值源于旅游体验结果，旅游体验结果体现在游客对目的地属性的感知评价，是游客价值的主要决定因素 [66]。张宏梅等认为，根据“途径-目的”范式，目的地游客感知价值存在“目的地属性-目的地体验结果-旅游者的价值观和终极状态”这一层次关系，而且将目的地属性与目的地体验分层次分析，更具有指导意义 [67]。特别地，对于上述“属性-结果-价值”链条中的价值的衡量，多数研究采用Zeithaml 对顾客价值的定义，认为顾客价值是顾客感知到的利益与其在获取产品或服务时所付出的成本进行权衡后对产品或服务效用的总体评价 [68]。本文将采用此概念，因为该定义强调了顾客对于成本的权衡，突出了动态比较的心理过程，与本文的研究目的相吻合。

综上，本文主要依据“途径-目的”范式，将旅游目的地的特征、环境、资源与管理等因素所赋能的目的地产品、服务等属性作为互动基础，将旅游者与目的地属性的关联互动生成的游客评论当作感知体验结果，进而探索以情感维度为表征的游客感知。

3 基于游客评论文本挖掘的探索性研究3.1 研究一：提炼游客感知的关键词和关键短语

关键词语或主题词汇是情感特征探析的基本元素，蕴含着旅游者的特定情感倾向，表达出旅游者的情感定向 [69-70]。TF-IDF与TextRank两种算法常结合使用，交叉验证游客评论内容的关键词，可以弥补单一算法挖掘关键词时准确性和全面性的不足，从而清晰地呈现出游客的真实感知。TF-IDF的核心思想是：字词的重要性随着其在文件中出现的次数成正比增加，但同时会随着其在语料库中出现的频率成反比下降。一般情况下，关键词出现频率越大，TF 值就会越大，其在文档中所占的比重就会越多，重要性也就越高 [71]。但文本评论内容包含较多无意义的通用词语和专属名词以及特定地点词语，削弱了游客评论中其他关键词的重要性，而逆向文本频率IDF 则反映出关键词的普遍程度。因此，TF-IDF算法有助于提高重要关键词的权重。同样地，TextRank算法主要通过词语之间的相邻关系构建网络，然后计算每个网络节点的Rank 值，最终通过排序Rank值提炼出关键词。TF-IDF算法对于语料库的依赖程度大，而TextRank算法可以直接对游客评论素材逐条进行分析，进而得到关键词。因此，通过结合利用TF-IDF 与TextRank 算法共同提炼游客评论的关键词，将关键词拓展成主旨更清楚的关键短语，进一步验证游客评论关键词的信度和效度 [72]。

因此，本文抽取出游客评论内容前5 个高频关键词和关键短语，如表2所示 ①为了观察比对ROST 对上述文本的处理结果，本文通过使用ROST CM6 软件进行分析，测得游客正面感知词频依次是大连32 994、广场26 480、公园24 435、表演19 742、孩子19 335、海洋18 324、景点13 148；游客负面感知词频依次是大连1385、景区1313、海洋馆1302、排队1173、门票1098，与本文TF-IDF 与TextRank 两种算法得出的结果存在较大差异。由于ROST提炼的大连、景区、广场、海洋等位置高频词语经人工抽样阅读核对，发现并非主题因素，因此导致其他主题因素的弱化。。

表2 游客感知的关键词和关键短语

Tab.2 Keywords and key phrases of tourist perception

（1）正面感知子范畴提取

金石滩风景区出现频繁的游客正面感知在于孩子，孩子的体验是游客感知的焦点。老虎滩海洋公园的关键词和关键短语主要表现在动物表演类词语较多，说明游客对于海洋公园的动物和植物类资源感知较深。独特的海洋资源景观是棒棰岛的景区特色，游客对于棒棰岛的海滩、海水、海景产生深刻的感知。星海广场的跨海大桥、城堡酒店和海鸥是目的地特色，尤其是城市夜景深受国内外游客的喜爱。圣亚海洋世界的海洋极地环境和动物表演是圣亚海洋世界主打的特色项目，也是游客直接感知所在。

（2）负面感知子范畴提取

金石滩风景区负面感知集中于导游、海滩、门票、垃圾、沙子，反映出金石滩风景区存在景区导游管理、游客数量和景区卫生等问题。老虎滩海洋公园负面感知聚焦于表演、设施、门票、工作人员等，结合景区设施旧、工作人员态度差、收费多等问题的感知，说明景区的管理不到位，同时游客对于景区表演节目、票价和收费等问题不满意。棒棰岛风景区负面感知围绕着管理、司机、观光车、接待、站岗，特别是景区的司机、观光车、接待、站岗特权等问题表现出景区的管理秩序和服务问题。星海广场的负面感知主要是啤酒味道、景色失望、管理乱、音乐吵、浴场垃圾等，说明景区的管理和卫生存在一定问题。圣亚海洋世界的负面感知的排队等待久、表演多、场馆远等，侧面反映出景区的产品规划和管理问题。

（3）子范畴归纳

上述通过文本挖掘得到的关键词和关键短语，类似于开放性编码经初步概念化得到的编码结果。为保证本文基于海量碎片化的文本进行挖掘的结果与人工编码结果之间不出现偏差，本文将通过TF-IDF 与TextRank 两种算法抽取游客评论内容获得的高频关键词放宽到前50个，然后选用部分长篇幅网络评论，采用人工贴标签和概念化的方式，得出与50个高频关键词基本类同的概念。因此，笔者基于理解关键词和关键短语阐发的意义归纳出12个子范畴。其中，将游客正面感知的子范畴归纳为目的地及旅游资源体验、情感体验等，将游客负面感知的子范畴归纳总结成情感体验、生态环境等，详见图1。需要指出的是，游客正面和负面感知在归纳和范畴化之后，并未分别得出完全一致的子范畴，故其区分度相较于人工编码更细腻，更有助于对感知形成过程的深入探究。

（4）游客感知范畴归类：基于“途径-目的”理论

首先是属性层次。从上述5个景区的产品属性看，均与海（自然景观）密切相关，有的侧重于观赏（如星海广场、棒棰岛），有的侧重于主题公园（如老虎滩、圣亚）。从目的地属性看，大连市内交通便利，气候怡人。从结果层次看，游客感知的正面结果占比比较高，负面结果占比低，且主要集中在少数几个维度（表1）。从感知价值层面看，既有“景色不错，有趣好玩，性价比高，游玩一体，特别是极地海洋馆表演，值得游客观赏，水城别具一格，在其他地方没有类似场，总体超赞。”（Q2154）这样的正面利益所得，也有“景色很一般，也没啥可玩的，全是人，景区标识差，五一也不限流，390多的门票，还不如随随便便找个海边走走。景色一般，可玩性低，性价比低，有待改进。”（Q1234）之类的负面损失。

基于游客感知体验结果而对感知范畴的诠释，主要基于如下阶梯法的思考顺序展开：旅游目的地的哪些因素产生了吸引力？游客从不同的旅游景区获得了哪些收益？这些收益为什么重要？即，由具体的旅游目的地属性抽象到产品或服务属性的体验结果，再进一步抽象到结果生成价值，自下而上地演绎出游客感知的多层次动态过程。根据郭安禧等 [73]和李艳 [74]的研究，目的地属性主要包括吸引物属性、体验属性、旅游服务属性以及个性化属性等方面。因此，本文所归纳的自然资源、生态环境和人文特色等子范畴主要为目的地吸引物属性，独特的海洋资源和特色人文活动（如啤酒节）聚合出以海景和地标等为代表的正向的盛宴收益，但是也产生喧闹、卫生等负面收益，正负收益主要聚焦在目的地有形与无形的吸引物的表现形式，故归纳为表征因素。而目的地及旅游资源体验、情感体验等子范畴主要为目的地体验属性，多样的吸引物带动浓郁的娱乐休闲氛围，提升游客以喜欢、开心、高兴等为代表的正面情感体验，相反，单一的情景剧和重复的舞台节目降低游客体验，带来表演不好、体验不佳的负面收益。这些正负面收益常为游客的主观效用判断，因此归纳为效用因素。另外，景区管理、景区规划、辅助服务、内外交通、时间安排等子范畴主要为目的地旅游服务属性，目的地整合管理和服务的规范与标准，满足游客对于景区管理、服务接待、环境卫生、基础设施等主要与辅助服务的要求，为游客打造出纪念品多、购物方便、时间便利等正面优质服务，同时也表现出设备旧、态度差、接待坑人、管理差等的多层级管理与服务问题，带来游客负面收益。这些涉及目的地景区管理与服务的问题呈现出多层级、多方面的结构性特征，因此归纳为结构因素。最后，游客特征与景区特征等子范畴主要为个性化属性，以孩子为代表的亲子与家庭旅游，多关注孩子的兴趣和个性带来的孩子适合、孩子开心等正面收益。而以特权站岗、司机车多、海岛小等为代表的景区特征，则引致游客的负面收益。李春晓等将游客个体特征与景区特征合并为特征因素，作为游客感知范畴的因素 [13]。本文也将其归纳为特征因素。因此，本文最终将12个子范畴合并成为表征因素、效用因素、结构因素、特征因素等4个感知范畴。这4个范畴为“目的”，它决定哪些“结果”（子范畴）是游客所关注的，最终决定哪些“目的地属性”（关键词和关键短语）是重要的（图1）。

图1 游客感知范畴的文本挖掘过程

Fig.1 Text mining of tourist perception categories

3.2 研究二：基于LDA主题模型的游客感知范畴差异

研究一已完成对游客感知范畴的归纳并总结出4个范畴，本部分将采用LDA主题模型对游客感知因素的重要性进行排序。LDA 主题模型的核心思想是将文本的主题以概率分布的形式呈现出来，然后对各个主题在文本中的关系进行聚类与降维，从而计算出主题的权重 [7]。鉴于以往相关质性编码研究并未考量各范畴在正负感知上的不同，故研究二将在研究一的基础上，对同样的研究文本进行主题抽取并赋权，试图探寻游客感知范畴内部的关键概念之间的相对重要度（表3） ①需要指出的是，因为算法的不同，研究二获取的主题词与研究一获取的关键词并非一一对应。但比对表2和表3的内容，可发现在范畴归属和情感归属两个维度均存在极大的相似性。这也交叉辅证了研究一的结论。。

表3 游客感知范畴的重要性差异

Tab.3 Differences in the importance of tourist perception categories

研究二呈现出游客感知范畴内蕴含的正负面情感特征的差异性。如表3所示，在表征因素方面，游客感知的正面情感维度占据绝对主流地位，其中以表演、动物多、浴场等为前5位的正面感知情感主题的权重远高于负面感知情感主题，从而表达出游客对旅游目的地特色和现代化的旅游资源的正向情感维度。类似地，在效用因素方面，以旅游资源与游客情感的正向体验为主，凸显出以很棒、开心等为代表的游客正向情感维度，而以喧嚣与不值当等负面情感维度权重较小。上述两个因素的负面情感关注点少、权重小，在情感体验中的存在感较弱。而游客感知的结构因素主要表现为以游客负面情感维度为主。游客感知负面情感维度以遮阴少、辛苦、场馆远等主题为主，负面情感主题主要聚焦于基础设施、景区规划、导游服务和景区管理以及内外交通等管理与服务层面，负面情感主题比较聚集。而结构因素的正面感知主题的权重虽相对较小，但仍有一定话语权，表达出部分游客对于景区购物条件和当地的服务尚可接受。在特征因素方面，游客感知的正负面情感主题权重差距相对较小，主要原因可能在于特征因素的客观性，其中游客负面感知因素以站岗多、不让进、司机车多等主题为主，一定程度上表达出游客对旅游景区限制问题的不满，未能及时分流且告知游客。而游客正面感知的情感主题主要以孩子、场馆多等为主，且孩子所占权重最高，很大程度说明亲子旅游对于特征因素的正向情感影响较大。因此，在不同的感知范畴内，有的正面情感占绝对主导权；有的负面情感为主要因素，但正面情感也在发挥作用；还有的正负面情感较为均衡。所以，研究二反映出游客感知范畴内部正负面情感存在不同程度的分歧，表达出游客感知情感维度的复杂性。

3.3 研究三：建构游客感知形成模型

承前所述，在提炼出游客感知范畴的基础上（研究一），结合游客感知范畴内部情感主题的重要性差异（研究二），将这些范畴围绕着游客正负面感知的动态发展进行关联，并根据1.1 部分整理出的游客感知内涵的重要研究成果，梳理出游客感知形成过程的故事线，最终构建出游客感知形成模型。

（1）旅游者与目的地的关联与互动

已有研究表明，游客感知形成过程始于旅游者获取目的地信息，旅游者与目的地之间的关联和互动是游客获取信息的关键所在，也是游客感知形成过程的基础环节 [67]。旅游者在获取目的地信息之后，通过对目的地信息内容的处理生成对于目的地的游前印象。同时，旅游者在旅游过程中与目的地之间的关联与互动为游客感知提供更加深入和全面的信息，其主要体现于旅游者与目的地特征、环境、服务与管理、旅游资源之间的关联与互动。如“去大连带孩子值得去的地方，让宝宝可以充分了解海洋世界。（X1202）小孩子的游玩天堂。（Q5547）确实很漂亮的小岛，景色宜人，闹中取静，值得来走走看看！带父母一起来的，慢慢逛也不累。”（X15228）“清澈的海水，秀丽的风景，孤立于海中的棒棰岛，度假胜地，跟网上宣传的差不多。”（Q57907）也就是说，旅游者对于目的地旅游信息的接受与处理方式导致游客感知形成和变化。因而，对于游客感知形成过程的研究需要充分考虑到旅游者与目的地之间的全程关联与互动，并以此产生的游客对于目的地的正面感知和负面感知。

（2）游客正负面感知的动态变化

旅游者正负面感知的动态变化是游客感知形成过程的核心环节，是决定游客感知体验结果的重要过程。准确地说，通过对游客正负面感知因素比较和调整的理解，诠释出旅游者与目的地的关联与互动过程，并解构出游客感知体验结果的意义。在很大程度上，借助对游客正负面感知因素的观察与解读，探寻和阐发游客感知的意义，增进对旅游者复杂动态情感的理解。具体而言，旅游者正是通过比较正负面感知因素，调整对于旅游目的地的认知与情感。这意味着，旅游者正负面感知的比较和调整是感知体验结果的关键所在，游客正是通过正负面感知因素之间的动态比较与调整，塑造游客的认知与情感，以此判定旅游目的地的旅游体验。对于游客正面感知而言，主要分布在旅游目的地的表征因素、效用因素和特征因素；如“金石滩延绵30多公里长的海岸线，汇聚了巧夺天工的地质奇观，如惟妙惟肖的大象吸水、大鹏展翅、猛虎扑食、恐龙吞海、贝多芬头像等，尤以龟背石震撼世界地质学界。”（X21475）“不愧是国宾级的，一下车就是海边，深呼吸，夹着海水的空气感觉立马把人的五脏六腑给清洗了一遍。海水非常干净。看着远处海天合一的景色，撑把遮阳伞一点都感觉不到热。建议到大连的朋友一定要去棒棰岛看看。”（X12005）负面感知大多体现在旅游目的地的效用因素、结构因素和特征因素等，主要是结构因素。如“金石滩度假区面积很大，需要搭乘景区大巴进入，景区内有多个小景区，有的比较坑，万福鼎景区就是一个，进去后巴士陪伴的导游会让你去测字然后让你交钱，很坑人的。”（Q42371）游客正负感知出现交叉意味着旅游者对于目的地大多处于正负面感知胶着的复杂状态。因而，进一步辨识出游客正负面感知孰轻孰重就显得尤为重要。再者，“比较”着重于关注游客正面感知与负面感知之间的动态变化，彰显出游客复杂的情感状态。而“调整”则是游客通过比较正负面感知得出新的结果。如 “看以前的照片，觉得海滩变小了很多，里面基本上是一个人为修缮的大公园，可以拍照游玩，景色还行，好像也有一些宾馆，可以入住，个人觉得没什么意思。但是宝贝第一次看大海，比较激动，看到孩子高兴，我也比较满足，下次还带孩子来。”（X20145）此处表现出游客由负面到正面的调整过程。如 “海水比较清澈，人也不是太多，沙滩比较大，看起来挺不错的，但离市区较远，如果单独只为来这里的话不太值得，不如在市区内的海水浴场玩玩就可以了。”（Q14967）而在此处体现出游客由正面到负面的调整过程。因此，旅游者正负面感知的动态变化彰显出游客对旅游目的地复杂的认知与情感，是建构游客感知的重要条件。

（3）游客感知的建构

游客感知的动态变化正是游客正负面感知相互比较和调整过程的结果，比较并调整后的游客感知塑造游客对于旅游目的地的认知与情感。这意味着，旅游者在旅游过程中不断对目的地正负面感知进行比较，调整游客对于目的地的评价和体验结果。如“起初到了以后感觉挺好的，景点比较多，景色挺美。只不过确实不需要买联票，地质公园才适合去看一下的，其他几个馆并不好，如果不是特别喜欢石头蜡像之类的，真的没有必要买联票。”（X4169）“园区人景挺好，体验比较好，但是园外很窝心。当地地痞垄断出租车，多倍抬高车价，欺压游客，给大连城市旅游抹黑。”（Q2453）更确切地说，游客正负面感知的差异是旅游目的地游客感知形成过程的根本原因。

总之，游客感知是一个过程，是建立在旅游者与目的地的关联和互动基础之上的。游客感知形成过程是旅游目的地正负面感知相互比较和调整的结果，是决定游客对旅游目的地认知与情感的重要过程。在此主要是通过比较游客正负面感知因素的重要性和优先度，形成游客对于目的地的动态感知，真实地反映出游客在整个旅游过程中心理活动的动态变化。基于此，在充分考虑前述研究和游客感知范畴的基础上，建构游客感知形成模型（图2）。

图2 游客感知形成过程模型

Fig.2 The process model for the formation of tourist perception

4 研究结论与讨论4.1 研究结论

本文通过计算机算法辅助研究者处理游客评论大数据，并遵循质性研究的范式提炼出游客感知范畴。不同于以往研究，本文细致地考察游客感知内部的正负情感主题数量和权重，描绘出游客感知范畴的情感词频和语义背后的深层次细节。研究发现，游客的目的地感知是动态演变的，游客感知子范畴内部的正负情感特征促成蕴含游客感知主范畴的析出。此外，游客感知形成过程包括旅游者与目的地的关联与互动、游客正负面感知的动态变化、游客感知建构3个过程，且3个过程之间存在相互联系。其中，旅游者与目的地的关联与互动是游客感知形成过程的基础环节，游客正负面感知的动态变化是游客感知形成过程的核心环节，是游客感知动态变化的根本原因，游客感知建构是游客感知形成过程的结果。

4.2 研究不足与展望

此外，本文主要围绕游客评论文本的单模态数据进行探索性研究，后续如果能够同时处理图片、音视频等多模态数据，会使得游客的目的地感知过程的研究更充分。再次，因为游客感知过程是一个心理活动，后续研究还可借助认知神经学等相关理论，采用眼动、脑电等设备进行实验研究，可能会发现更有深度的结论，这也是本研究后续努力的方向。最后，本文主要对单一案例（大连市）进行探索性研究，尚未采用多案例进行验证与补充，研究结论可能缺乏其他案例的佐证和完善，而多案例研究在研究情境还原和故事演绎方面具有显著优势。考虑到研究结论的普适性，后续研究将拓展到多案例研究，拓宽本文研究结论的边界，进一步深化理论贡献。

文章发表于《旅游学刊》2022年第3期，参考文献略。

下一篇：这是最后一篇

上一篇：这是第一篇