マルチ・ポテンシャライト
らしく、生きる。
プログラミング

Python3.6|Google検索トップ20のタイトルを取得する

本業はエンジニアのヨシヒロです。こんにちは。

 

私の本業はいわゆるエンジニアです。エンジニアでブログやってますって言うと、「プログラミングとかできちゃうIT系ですか?」と思われるかもしれませんが、私はいわゆるIT系ではない分野のエンジニアです。

 

工学系の学校を出ているのでプログラミングの実習なんかは学生の頃に経験があり、全く知らないと言うわけではないですが、プログラミングに関しては素人にちょっと毛が生えた程度です。

 

でも、いわゆるIT系のエンジニアが得意であろうプログラミングの技術などは、今や小学生でも習うほどの一般的なスキルになりつつあります。小学生でもプログラミング学習が必要だと言われるのに、私たち非IT系のエンジニアには必要ない・・・なんてことはありません。

 

プログラミングで仕事に必要なソフトウェアを作り、使っていくというスキルは、AIの登場に伴ってエンジニアの一般スキルになりつつあると感じます。

 

「私も簡単なプログラムくらい自分で書かなければ・・・」という焦燥感もありますが、プログラムに関わらず、「自分で作る」ということは基本的に好きなので、プログラミングには昔から興味がありました。プログラミングと言ってもExcelのマクロ(VBA)くらいしか作ったことがありませんが。

 

私の一番の趣味はDIYで家具を作ることなので、自分で作るものといえばもっぱら木工作業なのですが、最近はブログ運営を助けてくれるソフトを作ろうとプログラミングに奮闘しています。

 

と言うことで今回は、機械学習などにも使われるPythonというプログラミング言語を使って、Google検索をしてトップ20のタイトルを取得するという簡単なプログラムを作ってみました。

 

プログラム作成の理由

このプログラムを作った理由は、ブログ記事作成の効率を上げるためです。もしあなたがブログを書かれているとしたら、記事のタイトルをどのように決めていらっしゃるでしょうか?

 

やり方は人それぞれ、色々あると思いますが、書くからには多くの人に読んでほしい、という想いは、みんな共通していると思います。多くの人に読んでもらおうと思えば、やはり検索されやすいタイトルになっていることは不可欠ですね。

 

検索されやすいタイトルを知るためには、実際に検索してみることが一番です。これまでは検索キーワードを普通にキーボード入力してグーグル検索し、タイトルをひとつひとつテキストエディタにコピーして、それをざっと眺めながらどんなキーワードを入れたら良さそうか・・・と検索されやすそうなタイトルを考えていました。

 

が、検索結果からいちいちタイトルをコピーするのは結構手間がかかるので、少しでも記事作成の効率を上げるために、Pythonプログラムの作成に取り掛かり始めました。

 

前置きが長くなりましたが、この記事ではGoogle検索するPythonプログラムのソースコードをお示しするとともに、どんなことができるかをご紹介したいと思います。

 

開発環境

この記事を参考にして自分でもPythonプログラミングをされる方のために、私の開発環境を記しておきますね。
 
MacOS High Sierra ver10.13.4
PyCharm ver2017.3.3
Anaconda 5.0.1
Python3.6

 

ソースコード

以下がソースコードです。なお、私はPyCharmを使ってコーディングしています。PyCharmとは、ジェットブレインズ社が提供しているPythonの綜合開発環境(IDE)です。コードのエラーをハイライトしてくれる機能があったりすので、初心者にも優しい環境だと思います。

 

今回はこちらのサイトを参考にさせていただきながら作成しました。たくさんのエンジニアの方がソースコードを公開してくれているのでそれらを参考にさせていただき、とても勉強になります。

 

アラカン“BOKU”のITな日常
hatenablog.com

 

 

このプログラムでできること

このプログラムを実行してできるのは先にも説明した通り、グーグル検索をして検索トップ20のタイトルを取得することです。検索キーワード数は私はせいぜい3つくらいまでしか使わないので、1〜3のキーワード数で設定するようになっています。

 

本当はシングルキーワードでトップ表示されるようなブログ記事をたくさん発信したいのだけどね・・・

 

さて、実行した時の様子を以下に示します。ウィンドウ中の白文字はプログラムの出力、緑色の文字はユーザーの入力値です。プログラム実行の前に検索キーワードを決めます。今回は「Python、PyCharm、プログラミング」という3語で検索することにします。キーワードを決めたら、プログラムを実行します。はじめに検索するキーワード数を聞かれるので、入力します。(1,2,3のいずれか)

 

 

ちなみに、3以上の数字を入れたり、1〜3以外の文字を入力した場合は、以下のように表示してプログラムを終了します。この辺りがもっとスマートに書けるといいのですが・・・

 

 

次に、キーワード数に応じてキーワードを入力します。キーワード数が3つなので、Python、PyCharm、プログラミングという3つのキーワードを順に入力します。

 

 

キーワードを入力してEnterキーを押し数秒後、検索トップ20のタイトルがズラズラっと一覧表示されます。

 

 

はい。これだけです。これだけの超簡単プログラムですが、これができたおかげで、ブログ記事タイトルを決めるためのプロセスがかなり時間短縮できました!

 

補足として、今回はトップ20の検索結果を取得しましたが、これをトップ10にしたりトップ100まで取得したりは簡単に変更できます。コードの38行目のnum=20&q=・・・という部分を、num=10&q=・・・のように、取得したい数に変更するだけです。

 

おわりに

今後は、形態素解析(文章中のキーワードを抽出する作業)をできるようにしたり、検索ボリューム数を取得したり、exe化して世の中の非エンジニアブロガーさんにも使ってもらえたらいいな・・・なんて思っています。

 

プログラミングの基礎もおぼつかない私が書いたプログラムですので、本業プログラマーの方から見ると色々とツッコミどころもあるかと思います。突っ込んでいただけるプログラマーの方、ぜひ改善点を突っ込んでください(笑)勉強させていただきたく思います!

 

今回は自分の備忘録も兼ねてコードを記しました。Pythonをこれから始めてみようとしているあなたにもお役に立てれば幸いです。

 

最後まで読んでいただきありがとうございました。