liuyuqi-dellpc 7 years ago
parent
commit
5bf016614c
1 changed files with 19 additions and 7 deletions
  1. 19 7
      src/Python/movie-analysis.ipynb

+ 19 - 7
src/Python/movie-analysis.ipynb

@@ -1,11 +1,23 @@
 {
  "cells": [
   {
-   "cell_type": "code",
-   "execution_count": null,
+   "cell_type": "markdown",
    "metadata": {},
-   "outputs": [],
-   "source": []
+   "source": [
+    "# imdb电影评价情感分析\n",
+    "数据下载:keras包自带,来源于亚马逊网站,下载不了,所以只能使用百度云离线下载。下载后,放到input目录中。\n",
+    "\n",
+    "IMDb全称为互联网电影资料库(Internet Movie Database),是目前全世界最知名的电影评分网站之一,同时它的评分均来自于观众而非专业电影从业者。它目前的Alexa世界网站排名为55,而豆瓣为346。\n",
+    "\n",
+    "包括测试集和训练集。使用keras包进行数据分析"
+   ]
+  },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "## 1、导入包"
+   ]
   },
   {
    "cell_type": "code",
@@ -41,7 +53,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## 多层全连接神经网络训练情感分析"
+    "## 2、多层全连接神经网络训练情感分析"
    ]
   },
   {
@@ -209,7 +221,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## 卷积神经网络训练情感分析\n",
+    "## 3、卷积神经网络训练情感分析\n",
     "全连接神经网络几乎对网络模型没有任何限制,但缺点是过度拟合,即拟合了过多噪声。全连接神经网络模型的特点是灵活、参数多。在实际应用中,我们可能会对模型加上一些限制,使其适合数据的特点。并且由于模型的限制,其参数会大幅减少。这降低了模型的复杂度,模型的普适性进而会提高。"
    ]
   },
@@ -255,7 +267,7 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "## 循环神经网络训练情感分析\n",
+    "## 4、循环神经网络训练情感分析\n",
     "LSTM 是循环神经网络的一种。本质上,它按照时间顺序,把信息进行有效的整合和筛选,有的信息得到保留,有的信息被丢弃。在时间t,你获得到的信息(比如对段落文字的理解)理所应当会包含之前的信息(之前提到的事件、人物等)。LSTM 说,根据我手里的训练数据,我得找出一个方法来如何进行有效的信息取舍,从而把最有价值的信息保留到最后。那么最自然的想法是总结出一个规律用来处理前一时刻的信息。"
    ]
   },