@Wayne-Z
2016-09-27T20:26:12.000000Z
字数 17262
阅读 3026
作业
张文蔚(国软):组长,负责fastText的模型建构与使用,研究报告的撰写,主讲
朱奕安(国软):网页爬取、调查两岸交流途径的现状与解决方案
刘轶文(计院):对21世纪的台湾历史进行搜集和整理
冷 超(计院):对台湾教科书修改与文化活动进行搜集整理
余佩林(计院):对台湾人口成分与历史事件影响进行了搜集和整理
王子玥(计院):对20世纪的台湾历史进行搜集和整理、PPT制作与播放
近年来,有关两岸的舆论碰撞与摩擦层出不穷。从周子瑜事件到赵薇事件,我们看到了大陆网民对祖国统一的心切,也看到了大陆“非统即独”思想的根深蒂固。这样的视角并没有错,可是,大部分国人在发表观点的时候并没有对台湾的文化氛围与民众心理进行充分的认识,同样的,他们对我们也是一样。对于两岸关系或台湾问题,两岸人民的思想立场是否真的就只能按照“统一”和“独立”来进行分类?“非统即独”的观念对于促进当前两岸文化交流,改善两岸关系是否适用?要探讨两岸问题,两岸人民的思想共识又在哪里?基于这些问题,我们对台湾的近现代历史进行了一次整理和研究,并试图使用facebook在今年9月初刚开源的fastText项目对近年来的两岸事件进行舆情分析,力求针对上述问题给出一个客观的解答。
文章来自 Bag of Tricks for Efficient Text Classification by Joulin et al.
代码来自github我们撰写本文的时候源代码还在更新,重要的就是model.py文件。
图片来自原文,前期语料的处理因语料不同而异,以yelp的json格式的语料为例,stars即星级参数作为label,以text中的评价内容作为输入层机型训练。
上图是Mikolv在2013年发布的word2vec的文章,其中介绍了CBOW和Skip-Gram模型,经过两图比对,我们可以发现,FastText的模型其实由CBOW模型派生而来,由上下文推断演变为了全文的标签推断。在mikolov2013一文中,作者主要分析了影响运算复杂度的若干因素,最终发现,词向量的维度,数据集规模等对于整个复杂度的计算起关键性作用(此处仅提出了适用于本文文本分类的因素),这依然适用于FastText的模型。因此,本文在对数据集里面出现的词汇进行概率统计之后,采用霍夫曼编码的方式将语料进行了重新排列组合,将频率当做了概率。通过控制整个二叉堆的深度,实现了将小概率语料进行舍弃的目标,同时将关于数据集词汇数目的复杂度由线性级变成了对数级。可以看出,FastText训练的方式与过程本质上仍然与word2vec相同,主要利用的是梯度递减算法和反向传播算法。这两个算法的目的都是为了降低运算的复杂度,这也是FastText运算效率高的原因。但在实例代码中,作者在训练句向量——sentenceVector时,采用了onehot编码方式,在映射层直接调用了keras现成的函数,并标记使用函数softmax,因此在此处和原文的真正实现还存在些许差异。
def sentenceVector(tokeniser, dictionarySize, sentence, oneHotVectors, oneHotAveraged, contextHashes):
result = np.array([])
sequences = tokeniser.texts_to_sequences([sentence])
# Zero-pad every string
padded = pad_sequences(sequences, maxlen=SequenceLength)[0]
if oneHotVectors:
iptOneHot = [oneHot(dictionarySize, i) for i in padded]
result = np.append(
result,
np.mean(iptOneHot, axis=0) if oneHotAveraged else np.concatenate(iptOneHot)
)
if contextHashes:
buckets = np.zeros(dictionarySize * 2)
for t in range(SequenceLength): buckets[biGramHash(padded, t, dictionarySize)] = 1
for t in range(SequenceLength): buckets[dictionarySize + triGramHash(padded, t, dictionarySize)] = 1
result = np.append(result, buckets)
return result
···
···
def train(dataReader, oneHot, oneHotAveraged, contextHashes):
model = Sequential()
model.add(Dense(EmbeddingDim, input_dim=(oneHotDimension + contextHashesDimension)))
model.add(Dense(Labels, activation='softmax'))
model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
trainingGenerator = mapGenerator(dataReader.trainingData(n), tokeniser, dictionarySize, oneHot, oneHotAveraged, contextHashes)
validationGenerator = mapGenerator(dataReader.validationData(n), tokeniser, dictionarySize, oneHot, oneHotAveraged, contextHashes)
model.fit_generator(trainingGenerator,
nb_epoch=Epochs,
samples_per_epoch=SamplesPerEpoch,
validation_data=validationGenerator,
nb_val_samples=1000)
return model, tokeniser, dictionarySize
N-gram也是一种常用的方法。其原理就是默认在上下文中一个词汇的出现与前面N个词汇的出现存在关联性。本文采用Binary-gram作为一种额外特征,用于提高测试的精度。同时,由于词向量维度较大的,在数据集也偏大的情况下,为提高运算效率,本文通过采用高维度的哈希算法,一方面避免了哈希值重复的情况,一方面通过哈希值来进行映射和存储Binary-gram的运算结果也极大提高了运算效率,代码实例中有bigramhash和trigramhash两种方式可以选择。
def biGramHash(sequence, t, buckets):
t1 = sequence[t - 1] if t - 1 >= 0 else 0
return (t1 * Prime1) % buckets
def triGramHash(sequence, t, buckets):
t1 = sequence[t - 1] if t - 1 >= 0 else 0
t2 = sequence[t - 2] if t - 2 >= 0 else 0
return (t2 * Prime1 * Prime2 + t1 * Prime1) % bucketspython
本次报告中,我们另外自己编写使用了相关的网络爬虫进行信息的搜集和整理,为fastText提供了用于训练的相匹配的语料。网页爬虫的代码示例如下(朱奕安编写):
# -*- coding: utf-8 -*-
import requests
import bs4
import re
import json
def get_data(cookies):
data = []
username_list = []
for i in range(1, 42):
url = base_url + str(i)
response = requests.get(url=url, cookies=cookies)
content = response.content.replace('\n', '').replace('\t', '').replace('\r', '')
soup = bs4.BeautifulSoup(content, 'lxml')
c_list = soup.find_all(class_='c', id=re.compile('C_'))
for c in c_list:
comment = c.find('span', class_='ctt').text
username = c.find('a').text
if username not in username_list:
comment_data = {
'comment': comment,
'username': username,
}
data.append(comment_data)
username_list.append(username)
else:
index = username_list.index(username)
data[index]['comment'] += comment
print i
return data
# 新浪头条新闻
# 评论
base_url = 'http://weibo.cn/comment/E8m2VvNKU?uid=1618051664&rl=1&vt=4&page='
current_cookies = requests.cookies.RequestsCookieJar()
current_cookies.set('SUB', '_2A2562g2pDeTxGedP7VMQ8CnNwjmIHXVWJJPhrDV6PUJbkdANLWfakW1hQuuMANoS02TdHXEBctKHPD1gjQ..')
current_cookies.set('_T_WM', '72aa39d7e591be4646238a39cb0cb1d6')
current_cookies.set('gsid_CTandWM', '4uf3e6271ATbWl2HNNVCv4S3x39')
data = get_data(cookies=current_cookies)
json.dump(data, open('zll,json', 'w'))
帝吧出征,寸草不生,李毅吧是近年来国内诸多网络文化的发源地。在今年年初,韩国JYP旗下的艺人周子瑜被黄安曝光是台独拥护者,在网上引起不小的风波,最终周子瑜在YouTube上公开道歉,被林更新讽刺,继而引发了一场两岸之间的表情包大战。
在知乎网上,一位来自台湾的网友在说起周子瑜的事情时,还感慨说成长在陈水扁执政后时期的台湾年轻人,其实完全就不知道该怎么说自己的国籍身份,所以只能说自己是“台湾人”。
而每每涉及两岸话题的探讨,网络舆论上的交锋就迅速转变成了骂战,没有探讨,只有撕逼,没有深入思考,只有站队。那么,为什么两岸网民会对彼此如此不了解,近年来两岸的一些舆论事件又反映了什么?
我们可以先回顾一下台湾近百年的历史。
中日甲午战争以以中国战败、北洋水师全军覆没告终。中国清朝政府迫于日本军国主义的军事压力,签订了丧权辱国的不平等条约——《马关条约》。清朝在《马关条约》中割让了台湾岛及其附属岛屿和澎湖列岛给日本,至此台湾沦为日本的殖民地。在台湾省首府台北,割台的消息传来,
“若午夜暴闻惊雷,惊骇无人色,奔走相告,聚于市中,夜以继日,哭声达于四野,风云变色,若无天地”。
在自己不能主宰的情况下,被腐败的清政府出卖给日本,台湾人民的悲愤、无奈、绝望的心情,非外人所能体会。全台男女老少、市农工商、贩夫走卒,鸣锣罢市,涌入省府,愤怒抗议朝廷的割台行为,决心誓死保卫台湾。台湾著名诗人丘逢甲写下血书“抗倭守土”,并带头联名致电清廷,表示
“桑梓之地,义与存忘”,愿与驻台清军“誓死守御”。
1895年6月2日,中国全权代表李经方与台湾总督桦山资纪在停泊于基隆海面的日舰“横滨”号完成了台湾交接手续,而台湾人民则以“台湾民主国”的名义,发誓“愿人人战死而失台,决不愿拱手而让台”,在台湾岛上与日军展开数月的殊死斗争,是为台湾人民反割台斗争,又称“乙未战争”。
日本对台湾的影响:
- 正面:
开启了台湾的现代化进程,为台湾经济的发展打下了坚实基础。例如岛内交通的建设(至今很多仍在使用的铁路即是日治时期修的),台湾本土金融业的诞生等等。同时,开启了台湾工业化的进程;
引起了社会制度的变化,使台湾彻底脱离清朝逐渐走向现代社会。建立了良好的社会秩序,在岛内实行了法制;
为教育的发展打下了基础,开创了高等教育,职业教育等。例如,创建了台湾大学的前身,当时的台北帝国大学。培育了一批人才,提高了民众素质。文化上,破除了旧有风俗,向文明开放的社会风气过渡,并且使得台湾较早地接受了日本文化及西方文化先进优秀的一面,这种影响延续至今。- 负面:
殖民政府统治期间迫害杀害的台湾民众,包括汉民、原著居民,不计其数。制造了多起惨绝人寰的屠杀事件,杀害了无数的平民百姓,优秀的知识分子,血债累累;
二战时期,大量征召台湾人入伍,为其邪恶的企图充当炮灰,征集大量慰安妇,践踏妇女的权利。
疯狂的经济掠夺。利用台湾作为日本的经济后盾,大量利用台湾的人力物力、自然资源为日本本土服务。例如,大量的农产品输入日本,造成台湾物资的长期匮乏,农业遭到破坏。
文化上的同化。“皇民化教育”培养奴性,消弭民族意识,思想文化上奴役台湾。
台湾日据时期充满日本帝国主义殖民政策导向及活动形态。由于日本是最后一个跻身近代殖民帝国的国家,其帝国主义型态具有后进性,和西方由资本主义引导国家海外殖民政策不同,日本国内的资本主义尚不发达,无力在台湾从事大规模资本活动,因此日据初期,是由台湾总督府主导殖民地的开拓规划。原则上,由官方为日本资本家量身定做各种规则,迫使台湾提供资源、物产及劳力,为其服务。在国家发展定位上,日本将台湾作为支持本国工业的后盾,同时是日本向南方发展的基地。
台湾在日本时代,于政治、经济以及文化水平上得到相当程度的现代化。加上战后接收的中华民国国民政府治台失政,以及本地人与当时来台大陆人之间的思想隔阂,导致部份的台湾人,在战后对日本时期产生某些程度的怀念。而从此看,尽管战后中华民国政府在台湾输入民族主义教育、积极强调日本殖民台湾的负面影响,并将之与中国抗日战争类比等其他相关日本侵华成分。但台湾民间对日本仍大多抱持好感,与东南亚各国和印度等受日本侵略的国家相一致。日本留在台湾的建设所造成的正负面影响亦于近年来重新被检视或评价。
在教育方面,日本推行了国民教育,每一个儿童都有过六年的基础教育。但我们也要看到,在初期台人教育程度也远低于在台湾的日本人,日后逐年普及,但教育制度上与日人相比仍相对不平等。在卫生方面,日本设立了卫生警察,专职地监督人民,在日常生活中,注意公共卫生。严厉的公共卫生政策,使得一般的生活环境清洁健康。日本推行现代的医疗制度:台北帝大的医学院,训练许多本省的医生,在大城小镇照顾病人。于是,台湾流行的疾疫,霍乱、伤寒、疟疾等等,都一扫而空。
日本殖民当局,将刚从西方学来的法律应用在台湾,代替了中国传统的法律。日本在台湾实行特别法,以警察政治控制社会,台湾人没有平等的参政权,当时,刑事警察的权威,几乎是绝对的。日本在台湾施行的刑罚,严酷但至少是有法可据,不可任意地仗势欺人。法律严峻,却值得信赖,台湾居民真正认识了公权力的权威。
这许多建设,都是在后藤新平以及他的继任者,几个文人总督和文官,在日本据有台湾后,逐步开展。他们要在台湾建设一个模范殖民地。相对于日本在朝鲜的军事统治,日本在台湾推行的殖民统治,采取了完全不同的两条途径。
在这基础上,日本带来的现代文化的知识,和现代化的生活形态,更是难能可贵。清领时代的台湾文化近于空白。在这空白上,日本人铺设了一层从西方经过日本,移植到台湾的世界主流的现代文明。台湾的文化发展,就是经由这一途径,在文学、艺术、和音乐,各方面,都从日本,间接引进西方的文化传统。无可讳言,由于台湾不过是日本的文化边陲,在各方面,文化资源取自于日本本土,台湾文化能达到的水平,不免先天不足。而且,很难有开拓创新的空间。凡有的一些成就,遂更是难能可贵。因此,台民的同化,不能诠释说是同化于日本,其实有相当的成份,应当解释为同化于来自西方的现代,若不能理解这种现象,突然地责备台湾人“媚日”、“哈日”,那是不公平的。
五十年日本的统治,在后半段发动了“皇民化运动”。对于愿意接受日本文化的台湾同胞,要求他们必须在日常生活中,只用日语。当局要求他们采用新的日本姓氏,放弃原来的中国姓名。皇民必须放弃中国祭祀祖先的仪式,皈依神社的神道教。到太平洋战争时期,皇民家庭的人数,也不过是台湾人口的百分之七左右。太平洋战争爆发,日本需要台湾的人力支持,皇民化运动加速进行。1945年台湾光复,真正是皇民的台湾同胞人数,还不过全部人口的百分之十而已。
“二·二八事件”,发生于1947年2月28日,是台湾人民反专制、反独裁、争民主的群众运动。
1947年2月27日,国民党警员在台北误伤烟贩,群众激动。1947年2月28日,台北市民罢市、游行请愿,又遭国民党当局的镇压,激起了民众的愤怒,爆发了大规模武装暴动。几天之内,暴动民众控制了台湾省大部分地区。台湾省行政长官陈仪急电南京求援,国民政府调驻守上海的21军在基隆登陆,进驻台北,对群众进行大规模镇压,运动最终失败。
原因:
- 专制独裁
国民党对台湾人民实行军事独裁统治,行政长官公署集全省行政、司法、立法、军事大权于一身,形式上很近似于日本统治时期的总督,给人以不愉快的联想,认为国民党统治与日本人没有两样,都是专制独裁。- 经济冲突
在接收和处理日本垄断资本方面,凡战前日本人所拥有的企业,国民党政府均以“国有资本”的名义接收,而这些资本几乎垄断了台湾工业、金融、贸易等各个领域。台湾省政府还设立贸易局和专卖局,对贸易和烟酒实行政府专营、专卖,这些都与台湾民间资本、工商企业界发生了严重的利益冲突。- 贪污腐败
国民党跟在大陆一样,大员们热衷于“三洋开泰,五子登科”,热衷于下山摘桃子,吏治腐败,贪污盛行,军警横行,不到一年时间,接收变为“劫收”,台湾人民对国民党政府的态度由期望变为不满。
此后台湾社会受两种重要法领影响,一是系1948年5月10号实施的《动员戡乱时期临时条款》;另一种是1949年5月20号实行的《戒严令》,当时蒋介石总统以稳定政权、防止中共渗透为由,展开长期戒严,大兴报禁书禁,缉捕异见人士中警备总署更令不少台湾人心惊胆跳。虽然1950年代实行地方自治,县级以下民意代表、行政首长、省议会,理论上由公民直选产生,但前提是要听政府话,党外人士多数被排除出局。
此后,台湾经济开始腾飞。
1975年蒋介石病逝世,1978年蒋经国当选第六、七任总统台湾的政治环境发生了大逆转,台湾党外人士开始私印政论杂志,要求落实民主政治同言论自由。1979年12月,高雄市发生台湾规模最大的民主抗争活动美丽岛事件,示威者被军事审判,引起国际瞩目,陈水扁、吕秀莲等人在事件中渐露头角。
1980年代,台湾同香港、南韩、新加坡位列亚洲四小龙。但经济畅旺,并无令民主呼声减弱。相反,哄动朝野的陈文成命案、江南案、十信案相继发生,国民党的一系列暗杀行为使得台湾党外人士反抗更大,甚至得到了美国施压,卒之1986年,政府默许民主进步党成立;1987年7月14日蒋经国宣布解除戒严令,随后开放党禁、报禁,容许民众返大陆探亲、展开国会改革。而江南案中疑似扮演重要角色的蒋经国二子蒋孝武,从此无缘继承大统;1988年蒋经国去世,李登辉继任,蒋家王朝终于结束,台湾正式迈向现代政治。
1990年代,街头抗争已成为台湾人家常便饭,较出名有519绿色行动、鹿港居民反杜邦设厂事件、五二〇农运、无壳蜗牛运动等。李登辉在1990年议当选总统选举后,继续推动民主化同本土化,任内曾六次修宪。
1990年大学生发起三月学运,得到李登辉认同,同时,1998年,通过冻省政策,“台湾省”被变相废除,冻省、废省亦引发尖锐的统独争议。一年后,李登辉提出特殊两国论,宣称中华人民共和国同中华民国系两个对等“国家”,两岸关系持续紧张。
上文已经提到,20世纪90年代中后期,在权力渐趋稳固后,李登辉开始与两蒋时期执行的两岸政策分道扬镳,转向寻求所谓“台湾独立”。为达此目的,李登辉不仅于1999年在政治上抛出“两国论”,而且更进一步将黑手伸进教育领域,借鼓吹教育“台湾化”,推动“教育本土化”和“文化台独”等活动,试图透过洗脑塑造年轻一代的“台湾意识”,与早先作为中华意识之下的一种地方意识有着本质区别,培养新一代“台湾人”,为“台独”服务,将他们与中国文化之间的血脉联结一刀斩断。
因此,李登辉当局决定开放审定版教科书,在“一纲多本”政策指导下,修订高中课纲,并于1999年正式推行,因这一年为“民国”88年,俗称“88课纲”,其最大特点为在不脱离中国史范畴的前提下首次将台湾史单独放在一个单元之下,这也意味着原有全盘一律的意识形态开始松动。体现台湾本土意识的、包含历史篇、地理篇和社会篇三本《认识台湾》系列教材也于1997年上路,台湾史首次以课程形式出现于中学课程之列,内容则充斥了错误而卑劣的“台独史观”和“皇民史观”。
“同心圆”理论的主旨在于将台湾史从中国史框架中剥离出来,独立于中国史,类似于同心圆,第一圈为乡土史,第二圈为台湾史,第三圈为中国史,第四圈为亚洲史,第五圈为世界史,而且将中国史与世界史同等对待,杜正胜声称台湾中学历史课应改变过去以中国为中心的历史研究及教育观念,改从台湾出发,先认识台湾,然后了解中国大陆、亚洲及全世界。按此精神编撰的《认识台湾(历史篇)》公然宣称台湾文化仅是中华文化的一个源头,其地位与荷兰、西班牙、日本和欧美文化等同,“中国是敌国”,“台湾不是中国的一部分”,“台湾文化不是中国文化”,“中国文化粗鄙不堪”,必须将其从台湾文化中剔除出去,净化台湾文化的纯度,压缩各级学校有关中国语言和文化的课程比例,提高“台语”和台湾本土文化的地位。
自此以后,教科书中台湾史部分即从中国史独立,形成“台湾史—中国史—世界史”论述格局,台湾史的地位也由中国史整体构架下的地方史摇身一变为“国史”。该书将台湾史分为“史前时代”、“国际竞争时期”、“郑氏治台时期”、“清领时代”、“日本殖民统治时期”与“中华民国在台湾”等阶段,一律将荷兰、西班牙、清朝、日本、中国视为压迫台湾人的“外来政权”。同时美化日本在台殖民统治,不再称之为“日据”,强调日本为台湾带来“工业化”以及“守时”、“卫生”、“文明”等观念,却避谈其中的剥削与民族歧视。极力淡化抗日与光复运动,以“接收台湾”取代“台湾光复”。全书最后也不忘赞扬“落实民主法治”的“台湾经验”“是中华民国面对中共的威胁却始终屹立不摇的要因”,借此凝聚台湾人民的“生命共同体”意识。
与李登辉类似,陈水扁执政期间有关两岸问题的论述同样也经历了一个逐步倒向“台独”的蜕化和变质过程,与之相伴的则是他在诸多领域内的进一步“去中国化”行径,争议最为激烈的当属教育和文化两项,而中学教科书课纲的深度“绿化”更是成为各方众矢之的。
民进党时代,杜正胜当上教育部门负责人后以转型正义之名上任后即力主推行2003年由新竹清华大学编订的“台独”色彩甚为浓厚的课纲。因该课纲于2006年施行,但因其并未完成修订流程,因此也被称为“95暂纲”。该《暂纲》将台湾史与中国史完全分开,台湾史独立为第一册;将1945年以前的“中华民国史”列为中国史,1945年之后的部分列入台湾史;同时,也将确立台湾复归中国的《开罗宣言》定位为“新闻公报”,要求《旧金山和约》与《中日和约》纳入教材。
“95暂纲”上路后,杜正胜授权逢甲大学教授周梁楷在此前基础上继续进行修订工作,最后于2008年通过,这也就是原定于2009年施行的“98课纲”,它沿用了“95暂纲”基本框架,以杜正胜“同心圆”理论为指导思想,并以更大步伐加快历史论述中“去中国化”和“台独”双重步骤,而以此课纲为据所编写的历史教科书简直不忍卒读。 如对孙中山的尊称“国父”改为“先生”,“光复”变为“战后”,“中国第一大岛是海南”(而不再写台湾),“李白是中国的伟大诗人”,“我国国土面积36000多平方公里”,“中国是外国”,禁用“古今中外”,对于日本殖民统治则以中性的“日治”来取代“日据”,在谈及慰安妇来源时则说“除了风尘女子外,也有自愿到海外去从事慰安的妇女”
教科书将台湾史与中国史、世界史独立分册,形成两岸“一边一史”,其背后的“一边一国”意涵不言而喻。杜正胜卸任前的2007年,教育部门委托“独”派色彩浓厚的“台湾历史学会”完成《海洋教育与教科书用词检核计画》,要求各家教科书书商依此“标准”编写教材。这份报告检核了当时自小学至高中各领域各版本教科书,包含国文、社会、历史、地理、自然、生活科技、健康、体育、艺术与人文、地球科学、美术、音乐等科目,列出五大“不适合用词”“标准”:
- 不客观历史价值标准、刻意褒扬或贬抑的非中性词汇;
- 自我矮化为地区或主体意识不清,例如禁用“台湾地区”、“全省各地”与“两岸”等词;
- 台湾与中国大陆分属不同政权时期的叙述,对中国的地名、历史朝代、特定人物等,未加注国名,例如要求将“今山西省新绛县”的叙述改为“今中国山西省新绛县”,又如要求将“春秋战国时代”改为“中国春秋战国时代”;
- 叙述日治时期台湾的人、事、物却不使用大清帝国、中华民国纪年,例如要求将“中华民国16年”改为“大正5年”;
- 对于特定词汇的使用不够精确,例如规定不可使用“京剧、古典诗词”等词汇,来描述“中国特有的文物、文字、书画、戏剧、诗词等”;又如规定不得使用“历史上、古时候、古代、上古时代、老祖宗、古人、先人、先民”等词汇,来描述“时间或对象泛指中国古代或是古代之人”。
这份以政治力强行推动的“不适合用词检核报告”威力惊人,不过是一两字之差,但已将“台湾中国,一边一国”政治意识在潜移默化之中灌输给了台湾学生。长此以往,导致当前台湾社会各阶层早已将“一边一国”视为理所当然之事,如台湾人到祖国大陆参访工作求学一律自称为“出国”,称“陆生”为“中生”等等。台湾中小学近年来主要的新进教师无一不是读着1997年之后的“反中”、“反共”、“台独化”和“皇民史观”教科书成长的一代,“文化台独”思想和理念已经根深蒂固。
2008年5月20日,马英九就职台湾地区领导人。马英九对于历史课纲的编纂自有其一套想法,总体而言以“中华民国宪法”和“九二共识、一中各表”为准绳,遵循国民党传统历史论述,同时兼顾台湾本土民意,试图将已走偏的台湾重新拉回中国坐标。为此,马英九努力把中国因素更多留在台湾这块土地上,试图证明国民党政权非民进党人眼中的外来殖民者,同时认为陈水扁误用台湾历史情节,希望为本土论述寻找一个新方向,重建中国人意识。这也就可以理解马英九在理念上很难认同此前李登辉和陈水扁时期对历史课纲所做的“修正”。
为此,马英九时代的教育部门先是对此前的历史和国文课纲重新修订后定于2012年8月1日起实施,这也就是“101课纲”。该课纲虽是在国民党执政背景下所做的修订,但其主要内容和“98课纲”相去不远,甚至很多表述违背“一中”原则。2014年年初,教育部门以“错字勘误、内容补正及宪法之检核”为由,邀请具有泛蓝和统派背景的学者对“101课纲”进行修订,但在最后阶段临时动议进行课纲微调,强化大中国史观、台湾和祖国大陆之间的联结,突出日本殖民,这也就是“反课纲”运动中备受争议的“104课纲”,定于2015年8月新学期开学之际推行。
这部课纲中,“中国”改为“中国大陆”,“荷西治台”改为“荷西入台”,“明郑”代替“郑氏”,“清代”改为“清廷”,“日本统治时期”变为“日本殖民统治时期”,慰安妇前增加了“被迫”二字,“光复”取代中性的“接收”,强调清朝统治之下台湾的“现代化建设”,如电报、学校、铁路等设施的兴修。新增内容最大宗者旨在强调政府作为的主观能动性,如在经济发展上强调“国府”迁台初期的“土地改革、汇率改革、加工出口区、十大建设、科学园区”等;政治民主化部分也比现行课纲更强调“地方自治、开放党禁、解严、改选国会”等内容,甚至连社会文化部分也在“语言”后面加上“政策”二字。次大宗者则是对台湾地位与两岸关系的论述,值得注意的是,“104课纲”也将“二二八事件”与“白色恐怖”提升至课纲“重点”,前者更予以专节介绍,要求说明“二二八事件”发生的背景、过程与影响。
总体而言,“104课纲”不啻为马英九当局对“台独史观”和“皇民史观”的拨乱反正,如同王晓波自己所言的那样,“台湾高中课纲微调是正本清源”——在于“正中华之本,清两岸血脉渊源”,但就其更动规模来说其实还是远不如李登辉、陈水扁时期的课纲修订。
较之课纲的修订规模,马英九本人及其教育部门的乡愿做法则更令人失望。面对来自“反课纲”运动学生抗议层级的升高,教育部门不仅未能做好各方意见的协调沟通,反而一味妥协,最后只得针对“104课纲”的去留存废表示三点意见:新旧版教科书并行,以尊重教师专业自主选书权;新旧版教科书争议部分不列入大学入学考试命题;即刻启动课纲检讨程序,同步推动大家一起写教材计划。以高雄、台南、台中和桃园为首的民进党执政县市首长更是公开表态继续沿用旧课纲,对于教育部门的相关规定则完全置若罔闻,实质为旧纲照行。这样尴尬的结果再次体现了马英九个人政治手腕的不足和岛内整体民粹氛围的愈发浓厚。
我们可以看到,台湾当局通过“去中国化”的方式,利用教科书重构了台湾社会的历史记忆与群体认同。台湾出版不少有关台湾历史的著作,其中有的就明白地表示是为了“强化台湾的认同,凝聚台湾命运共同体的意识”,建构“台湾国家认同”,“扬弃原有由大中国意识主宰的社会主流论述,建立以台湾为主体的价值观”。
此外,通过“二二八博物馆”、纪念日、举办专题研讨会以及一些“独”派的媒体的宣传,多方配合,建构上述新的历史记忆。现在台湾至少有7座“二二八纪念碑”,通过悲情的历史记忆建构与深化“台湾主体认同”。1995 年在纪念马关条约签订一百周年时,台湾官方与民间分别举办了研讨会。《自由时报》选在马关条约签订日,邀请海内外学者,以台湾观点论述一百年历史的变迁,且配合媒体,刊登论文,广为传播。
这里所谓“台湾观点”是什么呢?当年与会的还有从美国、日本来的政客与学者,其中有人竟说出“台湾不应属于中国”,有人提出“中国是出卖台湾的国家。中国在任何危急的时候,随时可能再出卖台湾”。有人则明确指出:“强调台湾主体是为了突显台湾与中国之别”。这表明他们要建构的是与“中国观点”不同的“台湾观点”的历史记忆。与此同时,他们也制造了对日本殖民统治的历史失忆,不仅不讲日本的侵略,反而对日本殖民者歌功颂德。这表明他们在“重构过去的行动中,把过去的历史歪曲了”。这些历史记忆的建构者正是企图通过制造这样的“台湾观点”建构台湾的群体认同,以便与中国认同区别开来。他们的目的是通过建构新的国家认同的标准,来建构“新国家”。
制造新的历史记忆,目的就在于建构新的群体认同,即建构台湾的所谓“国族认同”。为此,李登辉和陈水扁对国民党统治时期所制造的历史记忆,采取“反其道而行之”的办法,力图达到否定中国认同的目的。首先是强调本土化,极力“去中国化”,企图淡化与割断两岸的历史关系,似乎台湾历史与中国历史没有关系。其次,制造所谓台湾的“特色”,把台湾的历史说成是与中国完全不同,并以这些特色作为“我群”的标准,以便与大陆分别开来。再次,把中国大陆的一切说成是落后的,而台湾则是先进的,制造对中国大陆的鄙视、厌恶甚至仇恨,把“台湾与大陆”、“台湾与中国”对立起来,最终达到只认同台湾不认同中国的目的。
讲台湾历史,强调本土化,这本来是无可厚非的,但是如果台湾史的‘恢复记忆’是尝试通过对中国史的‘失忆’而进行,就不是正确的态度。“去中国化”的结果,必然导致只认同台湾不认同中国。台湾过去十多年的‘国家意识’有了显明的变化,许多人的‘国家认同’从‘中国’转变成‘台湾’;许多人的自我认同也从‘中国人’转变成‘台湾人’。从李登辉到陈水扁,经过20年的政策推广,已经有很多台湾人觉得,说自己是台湾人,他觉得理所当然。但是他忘掉了,其实每个人的身份都不只是一种身份。”但有人却对“与中国一刀两断”感到高兴,称“二二八”具有里程碑的意义,因为“几百年来台湾人对中国的情结终于一刀两断,台湾人终于意识到台湾民族和中国民族之不同”。
正如一位学者所说: “不同的历史教科书把人们划分成不同的历史世界,而历史知识之不同亦大幅影响了人们的政治认同与政治抉择”。正因为在近20年中制造了新历史记忆,使得青年一代缺乏正确的历史记忆,而只有被建构的历史记忆,因而在群体认同上从“中国认同”转变为“台湾认同”,有人把它视为“国族认同”上的转变。当然建构新的历史记忆只是重新建构台湾群体认同的途径之一,在台湾社会“解禁”、政治开放、本土化发展的形势下,各种文化运动、社会运动、政治运动极力推动“去中国化”的群体认同或“国族认同”。十几年来,台湾的历史教育已经发生了严重的影响,有人指出: “两岸异己关系的‘台独’史观已经慢慢建立起来”; 在普遍30 岁以下的学生或社会人士,他们常觉得中国与台湾是互不相属的,事实上,改变台湾青少年的历史认同与国族认同,从小学历史教育即已着手,现在已经达到目的了。在本质上,这已经不是教育改革,而是‘国族认同’的改造了”。应当说,他们的历史教育与政治教育已经取得一定的成果,在分裂主义的道路上走出了严重的一步。
随着历史亲历者的老去,我们看到,在台湾新生代的眼中,真实的历史似乎渐渐的模糊,尤其是伴随着抗战老兵的离去,已经鲜有人为历史而抗争。
为此,我们还特地采访了一些有两岸生活经历的人。一方面,大陆去台湾旅游的人不少都感受到了生活氛围的差异,台湾人的生活节奏偏慢,宁静祥和,不少细节都体现出了优于大陆的文明素养,尽管大陆人民的素质也在不断提高。另一方面,随着近年来大陆经济的发展,台湾曾近的优越感已经逐步丧失,由强者心态转变为了弱者心态,这一点尤其体现在文化输出上,例如康熙来了,超级星光大道等综艺节目的没落,大陆综艺节目如奇葩说等在台湾的火爆;以及台湾偶像剧产业的衰弱与还有大陆影视剧琅琊榜等的流行;还有爱奇艺等视频平台在台湾的高占有率和诸多港台明星进入大陆捞金等,都体现了两岸之间的文化输入与输出发生了深刻的变化。
经过资料的搜集,线上和线下的两岸交流渠道整理如下。
线上
- 线上媒体方面: 台湾的主流媒体如苹果即时新闻网和联合新闻网在大陆均被中国防火长城所限制,无法在大陆正常访问。
- 社交媒体方面:台湾民众主要使用的facebook、twitter在大陆也都无法正常访问。而大陆人主要使用的微信qq微博都很少见到台湾民众的身影。
线下——官方
- “海峡论坛”这样的主题活动来促进两岸的交流合作
- 海协会和海基会这样的常驻组织来进行交流
- 《海峡两岸经济合作框架协议》的签署使得两岸的经济交流日益密切,但是两岸的政府在政治军事领域暂时没有任何的直接交流途径(在台湾军方误射导弹时间中,大陆8小时后才得到台湾的通报,而美国则第一时间得到了通报)
线下——民间
- 探亲: 随着在台湾的国民党老兵的逝去,两岸探亲所起到的交流意义在不断地缩减。
- 旅游: 今年1至4月台湾民众来大陆旅游达180万人次(海旅会台北办事处统计数据),大陆赴台游客每年约有300至400万人次(台湾《旺报》独家取得的台“内政部移民署”的数据)。
但是大陆游客去台湾旅游还是台湾民众来大陆旅游更希望专注与吃喝玩乐而有意避开在文化政治方面的冲突,于是很难通过旅游的方式加强两岸文化上的理解和认同。- 大学生:
- 2015年3238名大陆学生被台湾高校录取(人民日报海外版)(有多少台湾大学生在大陆找不到数据)还有更多的短期的交换生
- 在国际的一些赛事中大陆的代表队和台湾的代表队之间也能有交流的机会,如话语辩论邀请赛、星辩等著名辩论赛事
大学生们一起生活,可以极大增进互相之间的了解。而年轻人互相接受的能力比较强,误解与成见就不是很深,所以即便是来自不同的地方互相多多少少有些误解都可以走到一起互相交流。在学习的过程中,就很有可能碰到两岸文化经济政治的相关问题,就很有可能引发一场讨论,而学子之间的讨论通常都是高质量的(不像是facebook表情包那样的互撕),就很能增进互相之间的了解交流,消减互相的误解。
两岸的未来将会是年轻人主导,增进年轻人之间的理解将很有可能在将来极大的增进两岸之间交流和互信。因此,王正对当前青年们提出了如下几个建议
- 一、两岸青年交流的形式与内容应交由青年人来设计。青年人才了解青年人的需求与兴趣喜好,相关单位可把两岸青年交流活动的资源下放给学校有关台湾研究、两岸青年的社团,鼓励高校成立两岸性质的社团。
- 二、两岸青年交流要达到实效的话,需要好的带队者和引导者。带队者在两岸青年交流活动中起着重要的作用,引导正向思考。
- 三、在两岸青年交流当中,非正式交流的比重要比形式上的正式交流占更多。王正建议,两岸青年交流活动中十分之一是正式交流,例如研讨会、开幕式等活动形式,其他最好是非正式的活动,非正式类的活动需要有所设计。
- 四、体验和交流二者缺一就不是体验式交流。体验式交流中要注重体验,更要注重交流,二者不可或缺。
- 五、两岸青年交流应以较低成本达至更高效益。王正建议,两岸青年交流活动,青年住在学生宿舍,会比住在酒店要好,有所体验,成本还更低。
- 六、两岸青年交流人员组成应跨地域混合编组,将两岸地域间的竞争转为跨地域混合竞争。有些交流参访活动中,志愿者组成比例太少,形成不了更深入直接的交流,两岸青年人员组成上最好能够一比一。
- 七、减少大型活动,增加小型活动的比例,减少两百人以上的大规模活动场合,增进小规模团体的交流。
- 八、两岸青年交流的年龄层应下降至中小学生青少年。未来的两岸青年交流要转变成两岸青年交流和两岸青少年交流共同并进的格局。
此外,提出体验式交流的四种具体设计。
- 1、台大与广西大学的联合支教模式;
- 2、台大至北大的交流模式;
- 3、两岸四地青年文化交流模式:民生民情一日游、家访、分享会模式;
- 4、世界公民咖啡馆——两岸青年咖啡馆模式。
本次研究的一大遗憾之处,就在于关于使用开源项目fasttext的尝试并不能在规定期限内完成,原因是要训练出一个有意义且有预测作用的语言模型需要大量的样本先进行监督学习。fastText的基本原理如下
这样的样本需要几百兆的文档,可能需要几万人的语言样本,并且需要人工进行精确的归类,这样的工程量在短期内并不能有效完成。因此我们只能提供一个简单的demo,以及相关的网页爬虫代码,希望感兴趣的学者能够继续这样的研究。
归根结底,我们分析了这么多的史料和结论,都是在挖掘两岸之间的文化共识在哪里。可是经过上面一番对比我们会发现,很不幸,并不多,因为几十年来台湾民众已经失去了对于大陆的认同感,甚至没有了历史记忆。可是,探讨的基础,是共识,如果连基本的共识都没有,双方的讨论其实就是在自说自话,并没有深入的空间和余地。因此,如果我们始终站在我们的历史观点之上,从“非统即独”的观点来和对岸探讨两岸关系,我们始终只能利用强大的话语权,或强迫对方站队,或者流于表面的、无意义的争执。
在我们看来“非统即独”所具有的政治意义大于其学术意义或是文化意义,因为现实中,人们的立场并不是简单的二元对立,而更像是一个离散的点列。即,如果我们把支持统一,和支持台湾独立分别化为0和1的话,人们的持方并不都是在0,1上聚集,相反的,更多的人都是在0和1之间,不同程度地贴近其中一方,因此,如果只有“统”和“独”两种话语权的二元对立,0和1之间的大部分声音其实都会被埋没。再者,经过我们刚才的分析,我们可以看出,随着历史记忆的模糊和认同感的逐渐丧失,相比于从小就被教育台湾自古以来就是中国不可分割的一部分得我们,更多的台湾人其实早已对“统”或者“独”的问题并不关心,或至少已经失去了“统”的理由,对他们而言,重要的就是如何把当前台湾的生活过好,他们也并不对对岸的我们有多关心或多了解,甚至了解的兴趣都没有。我们眼中所谓的“独”,在他们看来,或许只是觉得没理由统一而已。
因此,一味地在大陆的话语权下讨论“统”和“独”的问题,或许并不能对两岸关系做出有效的改善和进步,当务之急,更在于加强有效的对话和交流,开启民智。毕竟,大陆的墙在尚处在网络之中,并不可怕,更可怕的墙,在心中。