《首届“算法控”马拉松程序设计竞赛》的评论 https://acmicpc.info/archives/1194?utm_source=rss&utm_medium=rss&utm_campaign=%25e9%25a6%2596%25e5%25b1%258a%25e2%2580%259c%25e7%25ae%2597%25e6%25b3%2595%25e6%258e%25a7%25e2%2580%259d%25e9%25a9%25ac%25e6%258b%2589%25e6%259d%25be%25e7%25a8%258b%25e5%25ba%258f%25e8%25ae%25be%25e8%25ae%25a1%25e7%25ab%259e%25e8%25b5%259b ACMer的信息平台 Thu, 07 Jan 2021 10:46:45 +0000 hourly 1 https://wordpress.org/?v=4.6.28 作者:Sweet https://acmicpc.info/archives/1194#comment-1281 Fri, 24 May 2013 02:02:00 +0000 http://acmicpc.info/?p=1194#comment-1281 咦?你的室友是谁?……

]]>
作者:sqybi https://acmicpc.info/archives/1194#comment-1099 Thu, 21 Feb 2013 17:20:02 +0000 http://acmicpc.info/?p=1194#comment-1099 之前做项目的时候,自己替换会有一些script或者css的东西容易出错,用parser靠谱一点。另外说不定树结构会有用。。。

]]>
作者:diaorui https://acmicpc.info/archives/1194#comment-1091 Wed, 06 Feb 2013 16:05:34 +0000 http://acmicpc.info/?p=1194#comment-1091 呃……本意是不希望用分词工具和机器学习软件包(本地训练参数可以用,上线的分类代码不能用)。HTML Parser倒是无所谓,比如Python语言已经自带HTMLParser模块了,不可能不让用。不过,有必要用HTML Parser?应该直接删掉标签和某些标签下的内容就好了吧?可以简单用正则替换。

]]>
作者:sqybi https://acmicpc.info/archives/1194#comment-1090 Wed, 06 Feb 2013 12:07:41 +0000 http://acmicpc.info/?p=1194#comment-1090 突然发现不能使用第三方类库——HTML Parser也要自己写么?

]]>
作者:diaorui https://acmicpc.info/archives/1194#comment-1089 Tue, 29 Jan 2013 20:53:48 +0000 http://acmicpc.info/?p=1194#comment-1089 好的,能模仿已有的赞助信息写一下吗?我好添加进去。

]]>
作者:diaorui https://acmicpc.info/archives/1194#comment-1088 Tue, 29 Jan 2013 20:51:32 +0000 http://acmicpc.info/?p=1194#comment-1088 提供的数据包括了题目所说的三种类别,但是没有标注是哪个类别,需要你自己想办法。下月我会给一个大约90%左右分类正确的计算结果以及大致思路,也是某个程序跑出来的,但是程序不提供。可以用做benchmark,和自己的计算结果做对比。

]]>
作者:diaorui https://acmicpc.info/archives/1194#comment-1087 Tue, 29 Jan 2013 20:47:57 +0000 http://acmicpc.info/?p=1194#comment-1087 这些不完全是positive sample,是没有标注的数据。

]]>
作者:phunter https://acmicpc.info/archives/1194#comment-1085 Sun, 27 Jan 2013 06:28:21 +0000 http://acmicpc.info/?p=1194#comment-1085 靠谱的是先用快速分词,然后剔除stop words然后用naive bayes进行训练,这是一个典型的document classification问题,并且是有固定学习主题是ACM,是一个已经清晰定义的问题了。现在只是需要楼主一些negative sample就能做好,并不需要一个很大的关键词词库啊什么的,输出结果就是个基本的bayes网络就行。

]]>
作者:phunter https://acmicpc.info/archives/1194#comment-1084 Sun, 27 Jan 2013 06:24:25 +0000 http://acmicpc.info/?p=1194#comment-1084 这些都是positive sample,没有提供个negative sample集合么,还是自己把这3000个分出来?

]]>
作者:LillianXiong https://acmicpc.info/archives/1194#comment-1081 Fri, 25 Jan 2013 09:33:45 +0000 http://acmicpc.info/?p=1194#comment-1081 我室友说她可以赞助英库输入法贴画

]]>