開発

はじめに

pandas、いいですね。

基本的な集計はこれですべて事足りるのではないかと思うほどです。
SpreadsheetやMySQLになまじ慣れてしまっており、本腰入れて勉強していなかった過去を反省しています。 ...

開発

はじめに

泥臭い系の話です。
結論、正規表現とsedを使えると効率化がめちゃくちゃ捗ります。

具体的な事例

例えばこんなケース:

特定の顧客の売上金額をDBから集計したい。
DBにはsalesテーブルがあり ...

開発

はじめに

2020年になりました。昨年どんな本を読んだか振り返ろうとしたときに、リストを作るのが面倒だったので書いてみました。

概要

流れは以下です。

Amazonから履歴を取得し、HTMLファイルとして保存
Be ...

開発

はじめに

文字列の類似度を定量化する手法を調べたのでPythonでの実装方法と簡単な結果をメモします。
3つのアプローチを紹介します。

ゲシュタルトパターンマッチング概要

文字列同士の連続する共通部分を抜き出し、抜き出 ...

開発

mergeで2つのDataFrameを結合できる

複数のDataFrameを、共通の列でまとめることができます。
SQLのJOINに近い使い方ができます。

基本的な使い方pd.merge(, , on='{カラム名}',h ...

開発

はじめに

pandas.groupby()を実行すると以下のエラーメッセージが出ました。

ValueError: Grouper for '' not 1-dimensional

エラーメッセージを読んでデータの中身を見ると、 ...

開発

はじめに

VirtualBoxでローカルに環境を構築してゴニョゴニョやっていたのを、
外部マシン(同一ネットワーク)からSSHの公開鍵(パスなし)で接続したくなりました。

その設定でハマったので解決策を共有します。 ...

開発

前回でマウスクリックが取れたので、同じpynputでキーボード入力まで取得してみました。
ただ、今のところはMacOSでは正しく動かせていません。※Windowsでは問題なかったです。
試行錯誤の記録を残します。

開発

マウスのクリックイベントを取得して、処理をさせてみます。
pynputというライブラリを使うと楽に実装できました。

pynput のインストールpip install pynputサンプルを動かしてみる

まずは公式ド ...

開発

小ネタです。
ファイルを扱う処理で、ファイル名によって分岐させたいときがありました。
結論から言うとファイルオブジェクトのnameメンバにアクセスすれば取得できます。

具体的には、