<input id="0qass"><u id="0qass"></u></input>
  • <input id="0qass"><u id="0qass"></u></input>
  • <menu id="0qass"><u id="0qass"></u></menu>

    自定義博客皮膚VIP專享

    *博客頭圖:

    格式為PNG、JPG,寬度*高度大于1920*100像素,不超過2MB,主視覺建議放在右側,請參照線上博客頭圖

    請上傳大于1920*100像素的圖片!

    博客底圖:

    圖片格式為PNG、JPG,不超過1MB,可上下左右平鋪至整個背景

    欄目圖:

    圖片格式為PNG、JPG,圖片寬度*高度為300*38像素,不超過0.5MB

    主標題顏色:

    RGB顏色,例如:#AFAFAF

    Hover:

    RGB顏色,例如:#AFAFAF

    副標題顏色:

    RGB顏色,例如:#AFAFAF

    自定義博客皮膚

    -+

    學習容易上癮

    就隨便寫寫自己的一些東西

    • 博客(39)
    • 問答 (1)
    • 收藏
    • 關注

    原創 【每日學習】深度學習相關知識

    1、【2019年11月8日】過擬合與欠擬合過擬合和欠擬合是常見的機器學習概念,這里寫一下,為后面的BN層學習奠定基礎。我們可以用下面的圖來表示:最左邊為欠擬合,可以看出擬合程度不是很好,經常會造成訓練中精度不高。最右邊為過擬合,曲線很好擬合了樣本,以至于噪聲數據也被擬合,經常會造成實際測試精度不高。中間的就擬合的非常好,即保證了正常樣本的擬合,又確保了噪聲數據不會被擬合。(1)欠擬...

    2019-11-09 14:30:29 219

    原創 【每日學習】圖像處理相關知識

    鑒于基礎知識掌握的太差,特此開貼,以分類為題目,每天更新一條學習記錄。監督自己,好好學習相關理論知識。1、【2019年11月6日】霍夫變換常見的有霍夫直線檢測與霍夫圓檢測。霍夫變換運用兩個坐標空間(直角坐標系與參數空間)之間的變換,將在一個空間中具有相同形狀的曲線或直線映射到另一個坐標空間的一個點上形成峰值,從而把檢測任意形狀的問題轉化為統計峰值問題。Hough直線檢測的基本原理在于利...

    2019-11-06 20:50:06 220

    原創 如何生成大批量的可以訓練的數據

    深度學習中,讓一個模型能夠有更好的泛化能力,最重要的根本就是數據的多樣性。但是現實中場景數據復雜多樣。以OCR文檔識別為例,一方面收集會耗費大量精力(文檔圖像拍照等等),另一方面,標注過程費時費力,不僅需要標注文本位置,還需要標注其對應的label信息。以下僅為思路參考:1、有可以大量使用的電子版數據(數據庫、文本文檔等)2、利用word模板生成對應的word文檔3、docx...

    2019-10-23 10:46:19 436

    原創 上采樣、上池化、雙線性插值、反卷積梳理

    在深度學習的網絡模型中,不但有通過卷積獲得圖像特征,而且也有一些放大操作,例如FCN、U-Net等等。這些操作有上采樣(Upsampling)、上池化(Unpooling)、雙線性插值、反卷積。下面對這四個進行梳理。一、上采樣(Upsampling)上采樣概念:上采樣指的是任何可以讓圖像變成更高分辨率的技術。最簡單的方式是重采樣和插值:將輸入圖片進行縮放到一個想要的尺寸,而且計算每個...

    2019-09-04 16:38:21 2480

    原創 RuntimeError: CUDA error: an illegal memory access was encountered

    CRNN訓練出現了RuntimeError: CUDA error: an illegal memory access was encountered錯誤。使用的PyTorch 1.1,自帶CTCLoss函數。查閱資料,發現既不是字典少字,也不是空格以及換行符的原因。發現最后的錯誤來源是因為CTC函數,于是更換成了https://github.com/SeanNaren/warp-ct...

    2019-07-20 12:51:34 12738 1

    原創 Python-OpenCV之圖像與位置標注的仿射變換

    不管是在目標檢測還是在OCR文本檢測的時候,都會有數據預處理這一步。那我們在對圖像進行縮放、旋轉的過程中,標注的位置信息肯定也是會變化的。1 縮放圖像利用OpenCV進行縮放,我們可以使用resize方法進行。但是標注信息呢?以按照原點進行縮放為例,原圖大小的寬度和高度分別為w和h,我們可以先求出在高度和寬度上縮放的比例。這樣在resize的時候可以指定fx和fy的縮放比例了。然后針...

    2019-07-08 18:07:05 586 1

    原創 OCR目前的發展現狀綜述

    本文目的是為了總結OCR各類技術的發展,從搜集資料到整理,可以看出OCR技術目前的一個大致發展趨勢。目前還處于隨時添加狀態,敬請期待!【更新時間】2019年9月26日【很好的參考資料】這個GitHub收集了文本檢測、文本識別、端到端的論文以及部分開源代碼,很好的學習資料!1 OCR的應用場景目前OCR的應用場景主要分為以下三個方面:1、自然場景下多形態文本檢測與識別...

    2019-06-14 10:32:15 10825 1

    轉載 【轉載】從編程實現角度學習Faster R-CNN(附極簡實現)

    【原文地址】https://zhuanlan.zhihu.com/p/32404424【GitHub極簡實現】https://github.com/chenyuntc/simple-faster-rcnn-pytorch陳云大神的文章,從編程的角度幫助理解Faster R-CNN,我學習PyTorch就是跟著他的書開始的。1 概述在目標檢測領域, Faster R-CNN表...

    2019-04-13 20:13:51 316 1

    原創 【論文筆記】端到端文本檢測與識別——FOTS

    常見的深度學習OCR過程中,會把文本檢測與文本識別拆分成兩個部分,通過先檢測后識別的方法對圖片中的文本進行OCR識別。在商湯的paper中,一種新的端到端快速檢測識別模型給了我們一個很大的驚喜。【論文題目】FOTS: Fast Oriented Text Spotting with a Unified Network【摘要】偶然的場景文本定位被認為是文檔分析社區中最困難和最有價值的挑...

    2019-04-12 15:27:54 3363

    原創 遇見你,是我幸福的開始

    2016年9月,在完成了本科四年的學習之后,我又一次坐上了前往北京的列車,踏上了碩士學習深造之旅。在這里,第一次遇到了你,在我心里,你是一個陽光開朗、積極向上、可愛漂亮的女生。研一的生活,是學習與活動一起進行的一年。在這一年,我們共同完成了拔河、跑步打卡、趣味運動會的項目。上課的時候,給你玩了紀念碑谷的游戲,一步一步幫助艾達公主完成任務,與此同時,我們也逐漸走向了愛情~后來,我們在秋天的時候爬...

    2019-04-03 16:13:47 711 2

    原創 【論文筆記】使用深度學習去除摩爾紋干擾

    針對之前數據采集過程中摩爾紋的嚴重干擾,導致OCR對這種圖片檢測與識別精度不高的問題,搜索了大量有關如何消除摩爾紋的資料,包括傳統的圖像處理方法以及深度學習方法,發現這篇論文無論從方法上還是效果上都挺不錯的。【論文題目】Moiré Photo Restoration Using Multiresolution Convolutional Neural Networks【摘要】數碼相機...

    2019-03-21 16:53:39 13779 9

    轉載 【轉載】【論文筆記】文本檢測之EAST

    【原文地址】https://zhuanlan.zhihu.com/p/37504120簡介論文題目:EAST: An Efficient and Accurate Scene Text Detector論文地址:https://arxiv.org/pdf/1704.03155.pdf代碼復現:https://github.com/argman/EAST傳統的文本檢測方法和一些基...

    2019-03-21 09:00:16 1326

    轉載 【轉載】【論文筆記】文本識別之CRNN

    原文地址:http://www.gifted-edu.com/dcrmg/article/details/80189819【論文下載】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text RecognitionCRNN是一種卷...

    2018-09-27 10:43:38 5781 3

    原創 OpenCV-Python的文本透視矯正與水平矯正

    已經感覺一個月沒有更博了,最近也是在找工作找實習。最近在看的就是如何使用神經網絡去做一個OCR識別,網上的資料多種多樣,包括分割單字進行識別的,也有不定長文字識別。網絡模型目前看到比較多的是CRNN,檢測的模型包括CTPN、YOLO等等。今天整理的是數據預處理上的文本透視矯正與水平矯正。一、透視矯正透視矯正是什么?比如發現了一頁紙,寫的挺好,你想拍下來,但是拍攝時角度的問題,你拍成了下...

    2018-08-22 09:58:19 14403 11

    轉載 【轉載】一篇搞定機器學習面試

    序言本文盡可能的不涉及到繁雜的數學公式,把面試中常問的模型核心點,用比較通俗易懂但又不是專業性的語言進行描述。希望可以幫助大家在找工作時提綱挈領的復習最核心的內容,或是在準備的過程中抓住每個模型的重點。實戰環境說明:Python 2.7 Sklearn 0.19.0 graphviz 0.8.1 決策樹可視化一、決策樹1.1 原理顧名思義,決策樹就是用一棵樹來表示我們的整...

    2018-07-09 15:47:23 8405 1

    原創 準確率、精確率、召回率、F1值、ROC/AUC整理筆記

    對于二分類問題,機器預測的和實際的還是會有所偏差,所以我們引入以下幾個概念來評價分類器的優良。一、TP、TN、FP、FN概念首先有關TP、TN、FP、FN的概念。大體來看,TP與TN都是分對了情況,TP是正類,TN是負類。則推斷出,FP是把錯的分成了對的,而FN則是把對的分成了錯的。(我的記憶方法:首先看第一個字母是T則代表分類正確,反之分類錯誤;然后看P,在T中則是正類,若在F中則實際為...

    2018-07-09 10:11:38 50859 4

    轉載 【轉載】目標檢測算法總結

    原文地址:https://www.cnblogs.com/guoyaohua/p/8994246.html目標檢測是很多計算機視覺任務的基礎,不論我們需要實現圖像與文字的交互還是需要識別精細類別,它都提供了可靠的信息。本文對目標檢測進行了整體回顧,第一部分從RCNN開始介紹基于候選區域的目標檢測器,包括Fast R-CNN、Faster R-CNN 和 FPN等。第二部分則重點討論了包括YO...

    2018-06-27 16:14:05 1339

    原創 2018百度西交大大數據競賽-商家招牌的分類與檢測

    【比賽官網】http://dianshi.baidu.com/gemstone/competitions/detail?raceId=17【賽題簡介】現實生活中的招牌各種各樣,千變萬化。針對初賽,在現實世界中,選取100類常見的招牌信息,如肯德基、麥當勞、耐克等。每類招牌挑選出10~30張圖像作為訓練數據,5~10張圖像作為測試數據。參賽者需要根據訓練集,構建算法模型,然后針對測試集進行分類,...

    2018-06-01 10:00:44 3718 7

    轉載 【轉載】常用數據增強方法總結及實現

    【參考資料】博客園-data augmentation 總結,CSDN博客-數據增強方法總結,海康威視研究院ImageNet2016競賽經驗分享【常用方法】1、Color Jittering:對顏色的數據增強:圖像亮度、飽和度、對比度變化(此處對色彩抖動的理解不知是否得當);2、PCA Jittering:首先按照RGB三個顏色通道計算均值和標準差,再在整個訓練集上計算協方差矩陣,進行特征分解,得...

    2018-05-17 19:55:42 5860 2

    原創 基于U-Net的眼底圖像血管分割實例

    【英文說明】https://github.com/orobix/retina-unet#retina-blood-vessel-segmentation-with-a-convolution-neural-network-u-net【更新】針對Python3版本對此部分代碼做了優化,已上傳到我的GitHub:點擊打開鏈接【注意事項】1.運行run_training.py或run_tes...

    2018-04-17 22:01:06 31879 255

    原創 Python-OpenCV中的Gamma變換(校正)

    【參考資料】http://www.gifted-edu.com/lichengyu/article/details/8457425 http://www.jb51.net/article/137566.htm一、什么是Gamma變換Gamma變換是對輸入圖像灰度值進行的非線性操作,使輸出圖像灰度值與輸入圖像灰度值呈指數關系:這個指數即為Ga...

    2018-04-16 21:47:07 21611 7

    轉載 【轉載】使用U-Net分割方法進行癌癥診斷(教程翻譯)

    【原文地址】http://www.gifted-edu.com/qq_30911665/article/details/74356112【原 作 者】 Jonathan Mulholland and Aaron Sander, Booz Allen Hamilton【英文地址】https://www.kaggle.com/c/data-science-bowl-2017#tutorial...

    2018-03-27 10:37:19 5472 16

    轉載 【轉載】常見醫療掃描圖像處理步驟

    【文章來源】http://www.gifted-edu.com/u013635029/article/details/72957944一、下載必要包skimage需要更新到最新0.13版本,否則會報錯,ImportError: cannot import name label。sudo pip install scikit-image -U -i https://pypi.tuna....

    2018-03-21 15:02:06 2490 1

    原創 PyTorch使用并行GPU處理數據

    【參考資料】http://www.gifted-edu.com/zzlyw/article/details/78769012 http://www.gifted-edu.com/daniaokuye/article/details/79133351 http://pytorch.org/docs/master/nn.html#dataparallel-lay...

    2018-03-16 11:39:13 27289 5

    原創 各類比賽數據集

    本篇整理了幾個比賽用的數據集,方便大家使用,提供百度云鏈接不定期更新,如果鏈接出現問題,請在評論區告知我,我會及時補鏈接【注意】所有數據僅限于科研所用,請勿用于商業用途!【2019.07.04更新】增加ICDAR 2015、天池全球數據智能大賽數據【Kaggle比賽】1.Kaggle-貓狗大戰鏈接:https://pan.baidu.com/s/1cnnZXytaaC...

    2018-03-07 10:34:51 12143 87

    原創 華碩超算服務器Ubuntu+CUDA+cuDNN+Anaconda+Tensorflow/PyTorch環境搭建

    【2018年8月3日更新】對于一些步驟進行了說明與調整,增加了一些可能遇到的問題。目錄一、Ubuntu16.04 Server安裝(有坑注意)二、安裝Nvidia 顯卡驅動(重點大坑,嚴加防范)三、安裝CUDA9/CUDA8四、安裝cuDNN7/cuDNN6五、安裝Anaconda(Python3.6)六、安裝Tensorflow(GPU版)/PyTorch七...

    2017-09-13 10:52:26 2082 2

    原創 【實驗樓】基于BP神經網絡的手寫體識別——python3版

    用自己的機器跑BP神經網絡手寫體識別,剛開始因為Python2與3之間存在不兼容,所以需要對代碼本身做一定的修改。(實驗地址:https://www.shiyanlou.com/courses/593)更新:Python3代碼已上傳到我的GitHub中:點擊打開鏈接實驗樓參考文檔:https://www.shiyanlou.com/courses/593/labs/1966/docu...

    2017-08-22 10:29:23 2295

    原創 Python3爬蟲小程序——爬取各類天氣信息(4)

    【爬取動態頁面的數據】更新:已上傳到我的GitHub上,點擊打開鏈接上一次講到用工具對動態頁面進行數據爬取,但是感覺難度不小,而且運行效率簡直低下。。。于是乎從網上查資料,有好多說可以通過獲取網站的json數據來進行動態頁面爬取,然后我就找到氣象數據權威——中央氣象臺的官網(http://www.nmc.cn/),開始數據的爬取。然后怎么去找這個json數據呢?在后臺開著抓包軟件F...

    2017-06-19 15:18:20 7184

    原創 Python3爬蟲小程序——爬取各類天氣信息(3)

    經過前面靜態頁面的爬取已經收集到很多信息了。最近在看怎么從動態頁面上爬取信息,主要用到的還是selenium+phantomJS工具(如何安裝?點擊這里查看),雖然存在一些缺點(效率不是很高),但是還算不錯。于是乎,前面從天氣網(http://www.tianqi.com/)上爬信息的我,轉到了中國天氣網(http://www.weather.com.cn/)。但是目前爬取數據存在一定問題...

    2017-06-15 15:09:53 5252 3

    原創 Python3爬蟲小程序——爬取各類天氣信息(2)

    【靜態頁面信息的爬取】更新:有關代碼已上傳到我的GitHub上,點擊打開鏈接根據前面做的那個爬蟲,進行了一些修改,例如對headers信息的偽裝。通過利用Fiddler抓包軟件,抓到headers信息,然后構造我們的頭信息進行爬蟲設計。抓包抓到的數據如下圖所示:Client中就是我們需要構造的信息,部分構造代碼如下所示:#模擬成瀏覽器headers={"Accept"...

    2017-06-14 11:19:12 1842 3

    原創 Python3爬蟲小程序——爬取各類天氣信息

    本來是想從網上找找有沒有現成的爬取空氣質量狀況和天氣情況的爬蟲程序,結果找了一會兒感覺還是自己寫一個吧。主要是爬取北京包括北京周邊省會城市的空氣質量數據和天氣數據。過程中出現了一個錯誤:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 250。原來發現是頁面的編碼是gbk,把語句改成data=url...

    2017-06-02 16:01:19 9604 3

    原創 Java Web開發中使用Mysql數據庫

    開發模式使用的是JSP+Servlet+JavaBean開發模式第一步 裝好數據庫。并在數據庫中建好需要使用的數據庫以及表。第二步 將數據庫連接jar包導入到工程文件中。Eclipse是導入到WebContent/WEB-INF/lib下,MyEclipse是導入到Webroot/WEB-INF/lib下。我用的是mysql-connector-java-5.1.6-bin.jar

    2017-03-14 15:47:42 6091

    原創 ASP.NET讀取Excel中的數據轉存到數據庫(二)

    上回說到讀取excel表格的時候,讀取到的第一個表在實際運行中并不是Sheet1這個表,可能是一個中文表名,也可能是Sheet1。所以首先可以改進這個地方,代碼如下:DataTable sheetsName = conn.GetOleDbSchemaTable(OleDbSchemaGuid.Tables,new object[]{null,null,null,"Table"}); /...

    2017-03-07 14:24:04 431

    原創 ASP.NET讀取Excel中的數據轉存到數據庫(一)

    【問題描述】近日需要做一些數據倉庫的內容,發現數據庫搭好了以后,所有的數據文件都是Excel存儲的。然而數據又是及其繁雜,所以在創建好了事實表和維度表以后,準備自己寫一個代碼將Excel中多維的數據導入到數據庫中。Excel表的部分數據如下圖所示所以需要對數據進行處理,處理之后添加到數據庫中。【準備工作】首先需要找到從Excel讀取數據的代碼。參考網址:http://www.j...

    2017-03-03 08:37:10 1947

    原創 ASP.NET無法使用sa用戶登錄數據庫原因及解決方案

    【問題描述】工程中web.config中寫了用sa用戶登錄數據庫。但是無法使用sa用戶中的數據庫。出現如下提示錯誤信息:【錯誤原因】(1)可能因為數據庫中sa用戶尚未啟用。(2)未知原因不能使用sa用戶來操作數據庫。(3)web.config文件中連接信息中的Integrated Security值設置為了true。【解決辦法】(1)sa用戶未啟用,可以使用W...

    2017-02-28 15:01:32 1859

    原創 Python實現K-Means聚類算法

    一、算法簡介1、K-Means算法是硬聚類算法,是典型的基于原型的目標函數聚類方法的代表,它是數據點到原型的某種距離作為優化的目標函數,利用函數求極值的方法得到迭代運算的調整規則。2、K-Means算法以歐式距離作為相似度測度,它是求對應某一初始聚類中心向量V最優分類,使得評價指標J最小。3、算法采用誤差平方和準則函數作為聚類準則函數。二、算法過程(1)從n個向量對象任意...

    2017-02-27 16:43:29 7488

    原創 使用VS2013與內置數據庫進行連接

    一、頁面的布置1、首先需要將頁面做好(本例的工程名為demo,框架用的是.NET Framework 4.5)。示例頁面代碼如下:<%@ Page Language="C#" AutoEventWireup="true" CodeBehind="Default.aspx.cs" Inherits="demo.Default" %><!DOCTYPE html&...

    2017-02-27 14:15:32 8735

    原創 Windows Server 2012 R2配置Tomcat服務器以及文件部署

    一、配置Tomcat服務器1、需要安裝的軟件:(注意安裝順序)(1)jdk-8u121-windows-x64(2)apache-tomcat-7.0.75(3)mysql-5.5.54-winx64(4)(可選)Navicat for mysql 10.12、由于Tomcat默認的訪問端口為8080,初始訪問地址為http://192.168.1.232:8080/。(個人IP...

    2017-02-27 10:58:44 30887

    原創 Miktex 2.9+Texmaker 4.4.1安裝及中英PDF生成過程

    一、安裝Miktex 2.9與Texmaker 4.41.下載: ①Miktex 2.9: http://mirrors.ctan.org/systems/win32/miktex/setup/basic-miktex-2.9.5105.exe。 MD5鑒別碼:AEC100C7920A001679B8217A3D862B19 SHA1鑒別碼:8...

    2016-07-16 19:51:17 23245 4

    空空如也

    空空如也

    TA創建的收藏夾 TA關注的收藏夾

    TA關注的人 TA的粉絲

    提示
    確定要刪除當前文章?
    取消 刪除
    多乐彩