酒店选址就是在综合考虑众多影响因素的基础上,确定酒店这个固定服务设施的*佳经营位置,以尽量地满足消费者短期住宿的需求,其正确与否直接关系到酒店未来的经营成败,是酒店管理者制定经营战略的重要依据。选址是酒店前期规划论证中一项非常重要的任务,国内外对酒店选址问题的探索始于上世纪80年代,起初以定性分析为主,近期多采用(模糊)多准则决策法、层次分析法(AnalyticHierarchyProcess,AHP)和神经网络(NeuralNetwork,NN)技术等,通过建立评价指标体系和选址模型的方式进行定量分析,取得了一定的研究成果,但是针对酒店选址的多指标决策问题,这些研究方法在建模原理上还存在一定的不足。譬如,(模糊)多准则决策法和AHP在建模过程中需要聘请专家人为地确定评价指标的权重,建模过程较为复杂,当指标个数较多时,专家很难对指标的权重值做出合理的判断,评价结果带有定的主观随意性。NN模型适于非线性问题的建模研究,但需要有足够多的训练样本,是一项非常难以掌握的技术,需要人为地反复试验确定网络的结构,因此当建模者对NN技术不能全面了解时,很容易建立“伪模型,‘,影响了评价结果的有效性。如果确定了太大的网络结构,致使其网络连接权值数远大于训练样本的个数,其训练过程中也没有采用检验样本监控训练过程,训练过程中会不可避免地出现”过训练“和”过拟合“现象。严格来讲,这样建立的NN模型不具有任何的泛化能力,其评价结果也是无效的。本文对此论文中的样本数据重新建立NN模型,验证其评价结果的不可靠性,同时分析比较NN模型与PPC模型在研究酒店选址微观选址问题上的适用性和可行性。
PPC技术适于非线性高维数据的建模研究,针对酒店微观选址问题多指标影响的特性,本文采用PPC技术建立酒店的微观选址模型,通过对已确立的投影指标函数的优化确立评价指标的*佳投影向量,并能综合成一维投影值实现对样本客观全面的评价。郑龙生对酒店选址有独到的研究,以郑龙生的样本数据建立PCC模型的实证研究表明,该方法不仅可以有效地描述选址样本的优劣等级,而且还可以通过*佳投影向量值确定评价指标的性质,对指标的重要性进行分析和排序,为酒店投资者及管理者制定经营战略提供重要的依据。
当指标越大越好时当指标越小越好时其中Xi,表示样本归一化后的数据,maxX和minX,分别为第个指标的*大值和*小值。需要特别指出的是,极值归一化的方式并不会影响指标的性质,PPC技术既可用作探索性研究,又可用作确定性分析,结合归一化的方式及*佳投影向量值的符号可以判定评价指标的性质,当采用越大越好的归化方式时,*佳投影向量值大于0,则该指标为正向指标,否则为负向指标。)映射后在一维空间的表示:目前常以样本投影值的标准差与局部密度之积来构造投影指标函数,即Q(a)=SzDz,这里Sz、Dz分别表示样本投影值Z(i)的标准差和局部密度,二者的表达式分别为:⑷其中,E(Z)为样本投影值Z(i)的均值;r(i,k)=|z(i)-z(k)|表示两个样本在一维空间的距离;R为局部密度窗口半径,u(R-r(i,k))为单位阶跃函数,时,函数值等于0.通过投影向量的映射,样本点在维空间的分布特征应符合局部投影点团内样本点尽可能密集,整体上投影点团尽可能散开的统计原则,因此可以通过求解投影指标函数的*大值来确定*佳投影向量,即:把由步骤3求得的*佳投影向量a代入函数公式(3)后求得各样本的综合投影值,根据Z(i)值的大小对样本进行评价与排序,值Z(i)越大样本越优。
二、商务酒店微观选址的评价指标体系及样本数据的来源选址是商业企业贯彻以消费者为中心的重要体现,是企业经营战略成败的关键因素,因此需要科学地综合考虑众多因素的影响。商务酒店微观选址是商业选址的一部分,同时受到产业集聚、土地费用、社会环境、商务环境、交通因素、扩建因素、城市规划因素等要素的影响,是一个复杂的多指标评价系统。郑龙生从这7个要素出发,选取周围产业相关性X1、竞争者数量X2、竞争者之间的距离X3、土地费用X4、公共设施完善度X5、公共秩序好坏X6、周围商贸繁花度X7、距中心商务区的距离X8、与交通站点的距离X9、到达交通站点的便利程度XW、停车场数量X、市内交通便利度X12、到商务活动区的便利程度XB、可扩建空间大小XM、与周围现有建筑的协调程度XB、与未来城建规划的协调程度XW共16个指标建立商务酒店微观选址综合评价指标体系,采用5点语义量表法量化各评价指标值。
表1 3组样本的*佳投影向量考虑到本文的重点在于比较PPC技术与NN技术在研究酒店微观选址时模型的适用性、可行性、有效性上的对比分析,因此不再赘述如何选取评价指标的问题,而是直接引用郑龙生的评价指标体系和58组样本数据。本文在实证建模研究分析中,首先以其中的55个训练样本建立PPC商务酒店微观选址模型,求得评价指标的*佳投影向量,接着以此投影向量计算3个备选址样本的一维投影值,以投影值为基础进而分析3个备选址样本的优劣。
三、商务酒店微观选址的实证建模研究1、基于PPC的商务酒店微观选址模型的建立将上述55个样本数据按照越大越好的归一化方式预处理后,带入MALTAB模拟软件仿真计算,选用多智能体遗传算法优化投影向量,算法的参数设置为:智能体网格的大小Lsize=20、竞争概率Po=0.2、交叉概率Pc=0.1、变异概率Pm=0.1、待优化函数的变量数目variablenum=16,设定循环迭代的*大次数为300,计算得评价指标的*佳投影向量如表1所示。此外,为了验证计算结果的准确性,本文对归一化后的样本数据额外地增加3个虚拟指标Xl7、Xi8、Xi9,并规定3个虚拟指标的取值为x17=1,x18=x1,x19=1-x1,即x19是指标米用越小越好的归一化方式预处理后的标准值。将增加虚拟指标后的样本数据重新带入仿真模型(此时调整待优化函数的变量数目variablenum=19)计算求得:xi与3个虚拟指标的投影向量值((,(,(算结果得出4个指标中指标的投影向量值等于0,指标x18与指标x1的投影向量值相等,指标x19与指标x1的投影向量值相反,这表明本文在建模过程中多智能体遗传算法的优化参数设置合理,基于PPC的商务酒店微观选址评价模型的计算结果可靠,此时的投影向量为*佳投影向量。
于求得准确稳定的*佳投影向量。PPC技术在确定指标权重时排出了人为因素的干扰,其权重的确定完全取决于样本数据本身,是典型的“数据驱动型”
模型。因此,为了研究样本数量对建模结果的影响,本文从原始样本中再抽取2组样本数据,计算这2组样本数据的*佳投影向量与原始的55个样本进行对比分析,以验证建模结果的稳定性。在抽取样本过程中,本文按照PPC建模样本数量多于评价指标个数的要求,分别抽取评价指标个数的1.5倍25个样本一组和评价指标个数的2.5倍40个样本一组,将这2组样本数据按照相同的越大越好的归一化方式预处理后,分别带入仿真模型计算,求得*佳投影向量如表1所示。
比较表1中3组样本的*佳投影向量可以看出,40个样本组和55个样本组的*佳投影向量完全吻合,而25个样本组中在指标x3、x5、x9、xW、xU的*佳投影向量值与40个样本组和55个样本组的存在差异。为了进一步挖掘这5个指标*佳投影向量值的差异,本文以往的研究分析指标的数据统计特征,选取表征集中趋势的均值和离散程度的标准差及表征分布偏斜程度的偏度和分布尖峭表25个指标的数据统计分析结果本文是先以55个训练样本建模求得评价指标的*佳投影向量,进而分析备选址样本的优劣,因此,PPC建模的关键在程度的峰度4项数据统计指标,陷于篇幅本文仅列出这5个指标的统计分析结果,如表2所示。
分析表2中5个指标的数据统计分析结果可以得出,较40个样本组和55个样本组相比,25个样本组中指标X3的标准差偏小、偏度偏大、峰度明显地偏大,指标X5的偏度偏小,指标X9的偏度明显地偏小、峰度明显的偏大,指标Xi的偏度明显的偏小,指标x的峰度明显的偏大,这表明25个样本组中这5个指标的数据结构特征与后两组样本不同,这也许可以解释其建模结果不相同的原因。上述的实证建模研究表明,当有足够多的典型性样本时,般要求样本的数量要多于评价指标的个数,由PPC技术建模可以求得稳健的*佳投影向量;当几组样本具有相似的数据结构特征时有PPC技术建模也可以得到相吻合的*佳投影向量。郑龙生选取同一城市的58家酒店作为研究样本,并采用NN技术以其中55个已运营的酒店为训练样本建模预测3个备选址样本的优劣,同理本文采用PPC技术建模由55个样本求得评价指标的*佳投影向量,以此计算3个备选址样本的投影值,分析3个备选址样本的优劣。
2、备选址样本的评价结果与分析将求得的*佳投影向量与备选址样本按照越大越好的方式归一化后的标准值(见表3)代入公式求得3个备选址样本的投影值依次为:Pl=-0.3001、P2=0.6681、P3=0.1750,投影值越大表明样本就越优,显然P2的投影值明显地大于P3和P1是选址的*佳地点。
表3 3个备选址样本归一化后的标准数据首先,评价指标的性质和权重分析。综合投影值实质是以*佳投影向量为系数的评价指标的线性组合,由*佳投影向量值的大小和是否大于0,可以判定评价指标的性质和分析指标的重要程度。投影值越大样本越优,因此*佳投影向量值大于0的是正向指标,*佳投影向量值小于0的是负向指标。分析表1中55个样本组的结果得出,指标xi、X2、X4、X5、X6、X7、X8、Xi3的*佳投影向量值大于0,是正的*佳投影向量值小于0,是负向指标。*佳投影向量值的绝对值越大相应的指标就重要,对投影值的贡献率就越高,分析16个指标的*佳投影向量的绝对值大小,对指标依重要性排名为X12、X1的*佳指标向量的绝对值大于0.3是相对比较重要的指标,它们对综合投影值的贡献率之和是55%,因此酒店投资者和管理者在进行酒店选址时应特别注意这几个指标,重点从这几个指标去分析酒店的地理位置特征,制定酒店未来的经营战略。
其次,评价指标间的相关性分析。上述分析表明有8个指标的*佳投影向量值小于0是负向指标,本文以权重较大的指标X3、xXM为例从指标的间的相关性进行分析。首先,指标竞争者之间的距离X3与正向指标周围产业相关性XI、竞争者数量X2和距中心商务区的距离X8存在明显的负相关关系,相关系数依次为-0.573、-0.549、-0.386.其次,指标市内交通便利度xu与正向指标周围产业相关性Xi、周边商贸繁华度X7和距中心商务区的距离X8之间是负相关的,相关系数依次为-0.291、-0.246、-0.283.*后指标可扩建空间大小x14与正向指标周围产业相关性XI、公共设施完善度X5、周边商贸繁华度X7和指标距中心商务区的距离X8存在明显的负相关性,相关系数依次为-0.367、-0.394、-0.511、-0.366.因此,上述指标与权重较大的正向指标之间是负相关的,模型判断它们是负向指标是合理地。
指标竞争者之间的距离X3当从产业集聚理论分析其是正向指标,当分析同行业之间的竞争其应为负向指标,因此人为很难判断其指标性质;指标市内交通便利度X12和可扩建空间大小XM主观判断应为正向指标,但它们与正向指标间存在明显的负相关性,因此本文的建模结果显示为负向指标是合理的。当指标个数较多时,指标之间会不可避免地存在相关性,本文采用PPC技术建模依据样本本身的数据结构特征,确定评价指标的权重和性质,避免了人为主观因素的影响,保证了评价结果的客观性和有效性。
3、郑龙生论文中存在的问题及对建模结果的影响首先,郑龙生的训练样本结果依据专家打分法获得,而这正是我们需要的*终评价结果,评价结果与评价指标之间是线性关系,NN模型是典型的数据驱动模型“garbageingarbageout”,再以NN技术对上述的样本建模并不能改变评价结果与评价指标之间的线性本质,因此没有必要再采用NN技术建立一个复杂的、非线性模型。
其次,郑龙生采用了太大的网络结构,也没有用检验样本监控训练过程,训练过程中很可能出现“过训练”现象,模型的泛化能力得不到验证,其评价结果也是无效的。由于郑龙生并没有列出样本的评价结果,经过与作者联系后,对方的电脑出现故障,也未能取得结果数据。而本文PPC的评价结果一维投影值与评价指标之间是线性关系,同专家打分法的评价结果形式上是相同的,因而作为训练样本的结果进行模拟计算是可行的。由于郑龙生设定的训练目标误差为0.00001,而结束训练时的实际训练样本误差是0.000079,因此本文将其目标误差理解为0.0001.将本文PPC的评价结果与55个样本带入Statsoft公司的神经网络软件重新建立NN模型发现:当采用没有隐层的网络结构建立线性评价模型时,训练精度很容易就达到目标误差0.6692,0.2134)与PPC的结果基本是一致的;而当隐层节点数取32时,分别选取总体样本数量的20%作为检验样本和测试样本,由于此时的网络连接权值数为577,远大于训练样本的数量,当训练样本误差达到0.0015时,训练过程已经发生“过训练”现象,如所示。继续训练直到训练样本误差满足小于0.0001的要求,表4给出了3次建模中3个备选址样本的输出结果。
从表4的结果中可以看出,3个备选址样本的表4 NN模型的建模结果隐层节点数训练样本误差评价结果PPC建模的结果输出结果大都偏离了期望值,优劣排序也都发生了变化,P2有可能是*优的,也有可能是*差的,即每次建模输出结果都是不相同的。因此,郑龙生的建模结果存在两个明显的错误:一是采用非线性的NN模型对一个线性系统建模,本文的实际建模研究表明这本身没有实际意义,当采用没有隐层的线性模型时,训练样本误差也可以很容易的达到目标误差的要求。即当用AHP、专家打分和PCA等线性模型获得样本的结果再带入NN技术建模,这本身就是错误的,而当采用简单的线性模型能够解决的问题,一般不会再采用NN技术建立复杂的非线性模型。二是确定了太大的网络结构,没有采用检验样本监控训练过程,本文实际建模研究表明其模型在训练过程中极易出现“过训练”现象,所得出的评价结果非常不稳定,没有任何意义。NN技术以其并行计算和对非线性问题的适应能力被广泛应用在众多领域,取得了良好的研究成果,但当研究者们在不完全了解NN技术的情况下而盲目地建模时,往往得不到理想的结果。
本文采用PPC技术建立商务酒店的微观选址综合评价模型,首先以55个样本求得评价指标的*佳投影向量,并通过增加虚拟变量和研究不同样本数量的影响两方面验证*佳投影向量准确性,接着以此*佳投影向量计算3个备选址样本的一维投影值,对3个备选址样本依据投影值大小进行优劣排序,实例建模研究表明本文的方法切实可行。
PPC模型依据样本数据本身的结构特征确定*佳投影向量,避免了人为因素的干扰,通过*佳投影向量值可以明确地分析评价指标的权重和性质。对于竞争者之间的距离主观上难以判断的指标和对于市内交通便利度、可扩建空间大小主观上判断应为正向指标的两个指标,本文通过分析与其它正向指标之间的相关性判断3个指标为负向指标,保证了评价指标性质和权重确定的准确性,确保了评价结果的客观性和有效性。
NN模型作为一个复杂的网络结构,主要适于非线性问题的评价研究,但是对训练样本的数量和质量有严格的要求。如果评价结果与评价指标本身存在线性关系,再采用NN技术建模则没有任何的实际意义;当模型采用了太大的网络,而又不采用检验样本监控训练过程,训练过程中很可能出现型没有任何的应用价值,其评价结果也是无效的。因此,对于训练样本数量不多,而样本结果又依赖专家打分获得的酒店微观选址问题,不适于采用NN技术建模。
PPC技术适于非线性高维数据的建模研究,针对酒店微观选址问题多指标影响的特性,本文采用PPC技术建立酒店的微观选址模型,通过对已确立的投影指标函数的优化确立评价指标的*佳投影向量,并能综合成一维投影值实现对样本客观全面的评价。郑龙生对酒店选址有独到的研究,以郑龙生的样本数据建立PCC模型的实证研究表明,该方法不仅可以有效地描述选址样本的优劣等级,而且还可以通过*佳投影向量值确定评价指标的性质,对指标的重要性进行分析和排序,为酒店投资者及管理者制定经营战略提供重要的依据。
当指标越大越好时当指标越小越好时其中Xi,表示样本归一化后的数据,maxX和minX,分别为第个指标的*大值和*小值。需要特别指出的是,极值归一化的方式并不会影响指标的性质,PPC技术既可用作探索性研究,又可用作确定性分析,结合归一化的方式及*佳投影向量值的符号可以判定评价指标的性质,当采用越大越好的归化方式时,*佳投影向量值大于0,则该指标为正向指标,否则为负向指标。)映射后在一维空间的表示:目前常以样本投影值的标准差与局部密度之积来构造投影指标函数,即Q(a)=SzDz,这里Sz、Dz分别表示样本投影值Z(i)的标准差和局部密度,二者的表达式分别为:⑷其中,E(Z)为样本投影值Z(i)的均值;r(i,k)=|z(i)-z(k)|表示两个样本在一维空间的距离;R为局部密度窗口半径,u(R-r(i,k))为单位阶跃函数,时,函数值等于0.通过投影向量的映射,样本点在维空间的分布特征应符合局部投影点团内样本点尽可能密集,整体上投影点团尽可能散开的统计原则,因此可以通过求解投影指标函数的*大值来确定*佳投影向量,即:把由步骤3求得的*佳投影向量a代入函数公式(3)后求得各样本的综合投影值,根据Z(i)值的大小对样本进行评价与排序,值Z(i)越大样本越优。
二、商务酒店微观选址的评价指标体系及样本数据的来源选址是商业企业贯彻以消费者为中心的重要体现,是企业经营战略成败的关键因素,因此需要科学地综合考虑众多因素的影响。商务酒店微观选址是商业选址的一部分,同时受到产业集聚、土地费用、社会环境、商务环境、交通因素、扩建因素、城市规划因素等要素的影响,是一个复杂的多指标评价系统。郑龙生从这7个要素出发,选取周围产业相关性X1、竞争者数量X2、竞争者之间的距离X3、土地费用X4、公共设施完善度X5、公共秩序好坏X6、周围商贸繁花度X7、距中心商务区的距离X8、与交通站点的距离X9、到达交通站点的便利程度XW、停车场数量X、市内交通便利度X12、到商务活动区的便利程度XB、可扩建空间大小XM、与周围现有建筑的协调程度XB、与未来城建规划的协调程度XW共16个指标建立商务酒店微观选址综合评价指标体系,采用5点语义量表法量化各评价指标值。
表1 3组样本的*佳投影向量考虑到本文的重点在于比较PPC技术与NN技术在研究酒店微观选址时模型的适用性、可行性、有效性上的对比分析,因此不再赘述如何选取评价指标的问题,而是直接引用郑龙生的评价指标体系和58组样本数据。本文在实证建模研究分析中,首先以其中的55个训练样本建立PPC商务酒店微观选址模型,求得评价指标的*佳投影向量,接着以此投影向量计算3个备选址样本的一维投影值,以投影值为基础进而分析3个备选址样本的优劣。
三、商务酒店微观选址的实证建模研究1、基于PPC的商务酒店微观选址模型的建立将上述55个样本数据按照越大越好的归一化方式预处理后,带入MALTAB模拟软件仿真计算,选用多智能体遗传算法优化投影向量,算法的参数设置为:智能体网格的大小Lsize=20、竞争概率Po=0.2、交叉概率Pc=0.1、变异概率Pm=0.1、待优化函数的变量数目variablenum=16,设定循环迭代的*大次数为300,计算得评价指标的*佳投影向量如表1所示。此外,为了验证计算结果的准确性,本文对归一化后的样本数据额外地增加3个虚拟指标Xl7、Xi8、Xi9,并规定3个虚拟指标的取值为x17=1,x18=x1,x19=1-x1,即x19是指标米用越小越好的归一化方式预处理后的标准值。将增加虚拟指标后的样本数据重新带入仿真模型(此时调整待优化函数的变量数目variablenum=19)计算求得:xi与3个虚拟指标的投影向量值((,(,(算结果得出4个指标中指标的投影向量值等于0,指标x18与指标x1的投影向量值相等,指标x19与指标x1的投影向量值相反,这表明本文在建模过程中多智能体遗传算法的优化参数设置合理,基于PPC的商务酒店微观选址评价模型的计算结果可靠,此时的投影向量为*佳投影向量。
于求得准确稳定的*佳投影向量。PPC技术在确定指标权重时排出了人为因素的干扰,其权重的确定完全取决于样本数据本身,是典型的“数据驱动型”
模型。因此,为了研究样本数量对建模结果的影响,本文从原始样本中再抽取2组样本数据,计算这2组样本数据的*佳投影向量与原始的55个样本进行对比分析,以验证建模结果的稳定性。在抽取样本过程中,本文按照PPC建模样本数量多于评价指标个数的要求,分别抽取评价指标个数的1.5倍25个样本一组和评价指标个数的2.5倍40个样本一组,将这2组样本数据按照相同的越大越好的归一化方式预处理后,分别带入仿真模型计算,求得*佳投影向量如表1所示。
比较表1中3组样本的*佳投影向量可以看出,40个样本组和55个样本组的*佳投影向量完全吻合,而25个样本组中在指标x3、x5、x9、xW、xU的*佳投影向量值与40个样本组和55个样本组的存在差异。为了进一步挖掘这5个指标*佳投影向量值的差异,本文以往的研究分析指标的数据统计特征,选取表征集中趋势的均值和离散程度的标准差及表征分布偏斜程度的偏度和分布尖峭表25个指标的数据统计分析结果本文是先以55个训练样本建模求得评价指标的*佳投影向量,进而分析备选址样本的优劣,因此,PPC建模的关键在程度的峰度4项数据统计指标,陷于篇幅本文仅列出这5个指标的统计分析结果,如表2所示。
分析表2中5个指标的数据统计分析结果可以得出,较40个样本组和55个样本组相比,25个样本组中指标X3的标准差偏小、偏度偏大、峰度明显地偏大,指标X5的偏度偏小,指标X9的偏度明显地偏小、峰度明显的偏大,指标Xi的偏度明显的偏小,指标x的峰度明显的偏大,这表明25个样本组中这5个指标的数据结构特征与后两组样本不同,这也许可以解释其建模结果不相同的原因。上述的实证建模研究表明,当有足够多的典型性样本时,般要求样本的数量要多于评价指标的个数,由PPC技术建模可以求得稳健的*佳投影向量;当几组样本具有相似的数据结构特征时有PPC技术建模也可以得到相吻合的*佳投影向量。郑龙生选取同一城市的58家酒店作为研究样本,并采用NN技术以其中55个已运营的酒店为训练样本建模预测3个备选址样本的优劣,同理本文采用PPC技术建模由55个样本求得评价指标的*佳投影向量,以此计算3个备选址样本的投影值,分析3个备选址样本的优劣。
2、备选址样本的评价结果与分析将求得的*佳投影向量与备选址样本按照越大越好的方式归一化后的标准值(见表3)代入公式求得3个备选址样本的投影值依次为:Pl=-0.3001、P2=0.6681、P3=0.1750,投影值越大表明样本就越优,显然P2的投影值明显地大于P3和P1是选址的*佳地点。
表3 3个备选址样本归一化后的标准数据首先,评价指标的性质和权重分析。综合投影值实质是以*佳投影向量为系数的评价指标的线性组合,由*佳投影向量值的大小和是否大于0,可以判定评价指标的性质和分析指标的重要程度。投影值越大样本越优,因此*佳投影向量值大于0的是正向指标,*佳投影向量值小于0的是负向指标。分析表1中55个样本组的结果得出,指标xi、X2、X4、X5、X6、X7、X8、Xi3的*佳投影向量值大于0,是正的*佳投影向量值小于0,是负向指标。*佳投影向量值的绝对值越大相应的指标就重要,对投影值的贡献率就越高,分析16个指标的*佳投影向量的绝对值大小,对指标依重要性排名为X12、X1的*佳指标向量的绝对值大于0.3是相对比较重要的指标,它们对综合投影值的贡献率之和是55%,因此酒店投资者和管理者在进行酒店选址时应特别注意这几个指标,重点从这几个指标去分析酒店的地理位置特征,制定酒店未来的经营战略。
其次,评价指标间的相关性分析。上述分析表明有8个指标的*佳投影向量值小于0是负向指标,本文以权重较大的指标X3、xXM为例从指标的间的相关性进行分析。首先,指标竞争者之间的距离X3与正向指标周围产业相关性XI、竞争者数量X2和距中心商务区的距离X8存在明显的负相关关系,相关系数依次为-0.573、-0.549、-0.386.其次,指标市内交通便利度xu与正向指标周围产业相关性Xi、周边商贸繁华度X7和距中心商务区的距离X8之间是负相关的,相关系数依次为-0.291、-0.246、-0.283.*后指标可扩建空间大小x14与正向指标周围产业相关性XI、公共设施完善度X5、周边商贸繁华度X7和指标距中心商务区的距离X8存在明显的负相关性,相关系数依次为-0.367、-0.394、-0.511、-0.366.因此,上述指标与权重较大的正向指标之间是负相关的,模型判断它们是负向指标是合理地。
指标竞争者之间的距离X3当从产业集聚理论分析其是正向指标,当分析同行业之间的竞争其应为负向指标,因此人为很难判断其指标性质;指标市内交通便利度X12和可扩建空间大小XM主观判断应为正向指标,但它们与正向指标间存在明显的负相关性,因此本文的建模结果显示为负向指标是合理的。当指标个数较多时,指标之间会不可避免地存在相关性,本文采用PPC技术建模依据样本本身的数据结构特征,确定评价指标的权重和性质,避免了人为主观因素的影响,保证了评价结果的客观性和有效性。
3、郑龙生论文中存在的问题及对建模结果的影响首先,郑龙生的训练样本结果依据专家打分法获得,而这正是我们需要的*终评价结果,评价结果与评价指标之间是线性关系,NN模型是典型的数据驱动模型“garbageingarbageout”,再以NN技术对上述的样本建模并不能改变评价结果与评价指标之间的线性本质,因此没有必要再采用NN技术建立一个复杂的、非线性模型。
其次,郑龙生采用了太大的网络结构,也没有用检验样本监控训练过程,训练过程中很可能出现“过训练”现象,模型的泛化能力得不到验证,其评价结果也是无效的。由于郑龙生并没有列出样本的评价结果,经过与作者联系后,对方的电脑出现故障,也未能取得结果数据。而本文PPC的评价结果一维投影值与评价指标之间是线性关系,同专家打分法的评价结果形式上是相同的,因而作为训练样本的结果进行模拟计算是可行的。由于郑龙生设定的训练目标误差为0.00001,而结束训练时的实际训练样本误差是0.000079,因此本文将其目标误差理解为0.0001.将本文PPC的评价结果与55个样本带入Statsoft公司的神经网络软件重新建立NN模型发现:当采用没有隐层的网络结构建立线性评价模型时,训练精度很容易就达到目标误差0.6692,0.2134)与PPC的结果基本是一致的;而当隐层节点数取32时,分别选取总体样本数量的20%作为检验样本和测试样本,由于此时的网络连接权值数为577,远大于训练样本的数量,当训练样本误差达到0.0015时,训练过程已经发生“过训练”现象,如所示。继续训练直到训练样本误差满足小于0.0001的要求,表4给出了3次建模中3个备选址样本的输出结果。
从表4的结果中可以看出,3个备选址样本的表4 NN模型的建模结果隐层节点数训练样本误差评价结果PPC建模的结果输出结果大都偏离了期望值,优劣排序也都发生了变化,P2有可能是*优的,也有可能是*差的,即每次建模输出结果都是不相同的。因此,郑龙生的建模结果存在两个明显的错误:一是采用非线性的NN模型对一个线性系统建模,本文的实际建模研究表明这本身没有实际意义,当采用没有隐层的线性模型时,训练样本误差也可以很容易的达到目标误差的要求。即当用AHP、专家打分和PCA等线性模型获得样本的结果再带入NN技术建模,这本身就是错误的,而当采用简单的线性模型能够解决的问题,一般不会再采用NN技术建立复杂的非线性模型。二是确定了太大的网络结构,没有采用检验样本监控训练过程,本文实际建模研究表明其模型在训练过程中极易出现“过训练”现象,所得出的评价结果非常不稳定,没有任何意义。NN技术以其并行计算和对非线性问题的适应能力被广泛应用在众多领域,取得了良好的研究成果,但当研究者们在不完全了解NN技术的情况下而盲目地建模时,往往得不到理想的结果。
本文采用PPC技术建立商务酒店的微观选址综合评价模型,首先以55个样本求得评价指标的*佳投影向量,并通过增加虚拟变量和研究不同样本数量的影响两方面验证*佳投影向量准确性,接着以此*佳投影向量计算3个备选址样本的一维投影值,对3个备选址样本依据投影值大小进行优劣排序,实例建模研究表明本文的方法切实可行。
PPC模型依据样本数据本身的结构特征确定*佳投影向量,避免了人为因素的干扰,通过*佳投影向量值可以明确地分析评价指标的权重和性质。对于竞争者之间的距离主观上难以判断的指标和对于市内交通便利度、可扩建空间大小主观上判断应为正向指标的两个指标,本文通过分析与其它正向指标之间的相关性判断3个指标为负向指标,保证了评价指标性质和权重确定的准确性,确保了评价结果的客观性和有效性。
NN模型作为一个复杂的网络结构,主要适于非线性问题的评价研究,但是对训练样本的数量和质量有严格的要求。如果评价结果与评价指标本身存在线性关系,再采用NN技术建模则没有任何的实际意义;当模型采用了太大的网络,而又不采用检验样本监控训练过程,训练过程中很可能出现型没有任何的应用价值,其评价结果也是无效的。因此,对于训练样本数量不多,而样本结果又依赖专家打分获得的酒店微观选址问题,不适于采用NN技术建模。
说声谢谢,感谢回答者的无私帮助