博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
网页抓取 总结
阅读量:4946 次
发布时间:2019-06-11

本文共 1080 字,大约阅读时间需要 3 分钟。

1、指针每次变化后使用后要判断 死是否为空

2、标志性 指针位置要 谨慎,尽量不要以 属性为标志,因为可能会 没哟,失去 标志

3、可以以 汉字后缀 作为  引导 地址时,一定要先 转化为 UTF-8后 再加到 后缀上

4、索引  网页源码时候,要有判空处理,空的时候 多次 索引,一面 网络延迟时候,没有抓到网页

5、预存网页的 数组一定要 足够大,一般 先放到UC上 看看大小,一般开导1024*100 以上 保险

6、存储 母 页面的指针和 数组,子页面不能使用

7、指针字符串接收字符串,申请内存的时候,记得要+1,因为strlen申请的长度,不带‘\0’,如果申请的长度不够。最后释放的时候出出错

    如下例子:

      

#include
#include
#include
int main(){ int i ; char a[256]= "sadasdsad"; char *b = NULL; char *FileContent = NULL; b = a;// i = 256; i = strlen(a);// i = strlen(a)+1; //正确写法 FileContent = (char *) malloc(i * sizeof(char)); //FileContent = "asdfasdfasdasdf"; strcpy(FileContent,b); free(FileContent); return 0;}

 8 、翻译的时候调用CodeConvert()函数的时候,要注意,不能直接用指针来接收参数,虽然它指向的是一段内存空间,

  但是第四个参数是 长度大小,sizeof的时候,长度是2,并不是他空间的大小,所以接收不到 参数,这时,一般可以

  暂时申请一个 数组,接收下,接收后 copy给这个指针就行啦

 9、二维数组 在调用时要注意,调用的二维大小要与定义时的大小一样大。f(char szInfo[][2048]);

 

   这几天抓取电影 信息的时候,遇到很多问题,首先是 数据库连接 不熟悉,出现很多错误,走了很多弯路,浪费了很多时间。

后来又因为 操作的格式不规范,出现很内存泄露的问题。以后多多注意!

转载于:https://www.cnblogs.com/zibuyu/p/3234873.html

你可能感兴趣的文章
JavaScript笔记——正则表达式
查看>>
iOS PushMebaby
查看>>
网页消息类
查看>>
【BZOJ】2959: 长跑(lct+缩点)(暂时弃坑)
查看>>
日常一些出现bug的问题
查看>>
同时启动多个tomcat服务器
查看>>
怎么将iphone上的照片导出到本地文件
查看>>
Repeater+DataPagerSource分页
查看>>
模块化导出
查看>>
pagebean pagetag java 后台代码实现分页 demo 前台标签分页 后台java分页
查看>>
Sphinx 2.0.8 发布,全文搜索引擎 Installing Sphinx on Windows
查看>>
pod
查看>>
ResultSet 可滚动性和可更新性
查看>>
VS2013 C++代码运行问题
查看>>
iOS 加载图片选择imageNamed 方法还是 imageWithContentsOfFile?
查看>>
LUOGU P2986 [USACO10MAR]伟大的奶牛聚集Great Cow Gat…
查看>>
toad for oracle中文显示乱码
查看>>
scala的REPL shell的调用
查看>>
SQL中Group By的使用
查看>>
Mybatis映射原理,动态SQL,log4j
查看>>