|
@@ -1,11 +1,23 @@
|
|
|
{
|
|
|
"cells": [
|
|
|
{
|
|
|
- "cell_type": "code",
|
|
|
- "execution_count": null,
|
|
|
+ "cell_type": "markdown",
|
|
|
"metadata": {},
|
|
|
- "outputs": [],
|
|
|
- "source": []
|
|
|
+ "source": [
|
|
|
+ "# imdb电影评价情感分析\n",
|
|
|
+ "数据下载:keras包自带,来源于亚马逊网站,下载不了,所以只能使用百度云离线下载。下载后,放到input目录中。\n",
|
|
|
+ "\n",
|
|
|
+ "IMDb全称为互联网电影资料库(Internet Movie Database),是目前全世界最知名的电影评分网站之一,同时它的评分均来自于观众而非专业电影从业者。它目前的Alexa世界网站排名为55,而豆瓣为346。\n",
|
|
|
+ "\n",
|
|
|
+ "包括测试集和训练集。使用keras包进行数据分析"
|
|
|
+ ]
|
|
|
+ },
|
|
|
+ {
|
|
|
+ "cell_type": "markdown",
|
|
|
+ "metadata": {},
|
|
|
+ "source": [
|
|
|
+ "## 1、导入包"
|
|
|
+ ]
|
|
|
},
|
|
|
{
|
|
|
"cell_type": "code",
|
|
@@ -41,7 +53,7 @@
|
|
|
"cell_type": "markdown",
|
|
|
"metadata": {},
|
|
|
"source": [
|
|
|
- "## 多层全连接神经网络训练情感分析"
|
|
|
+ "## 2、多层全连接神经网络训练情感分析"
|
|
|
]
|
|
|
},
|
|
|
{
|
|
@@ -209,7 +221,7 @@
|
|
|
"cell_type": "markdown",
|
|
|
"metadata": {},
|
|
|
"source": [
|
|
|
- "## 卷积神经网络训练情感分析\n",
|
|
|
+ "## 3、卷积神经网络训练情感分析\n",
|
|
|
"全连接神经网络几乎对网络模型没有任何限制,但缺点是过度拟合,即拟合了过多噪声。全连接神经网络模型的特点是灵活、参数多。在实际应用中,我们可能会对模型加上一些限制,使其适合数据的特点。并且由于模型的限制,其参数会大幅减少。这降低了模型的复杂度,模型的普适性进而会提高。"
|
|
|
]
|
|
|
},
|
|
@@ -255,7 +267,7 @@
|
|
|
"cell_type": "markdown",
|
|
|
"metadata": {},
|
|
|
"source": [
|
|
|
- "## 循环神经网络训练情感分析\n",
|
|
|
+ "## 4、循环神经网络训练情感分析\n",
|
|
|
"LSTM 是循环神经网络的一种。本质上,它按照时间顺序,把信息进行有效的整合和筛选,有的信息得到保留,有的信息被丢弃。在时间t,你获得到的信息(比如对段落文字的理解)理所应当会包含之前的信息(之前提到的事件、人物等)。LSTM 说,根据我手里的训练数据,我得找出一个方法来如何进行有效的信息取舍,从而把最有价值的信息保留到最后。那么最自然的想法是总结出一个规律用来处理前一时刻的信息。"
|
|
|
]
|
|
|
},
|