開発

はじめに

pandasのDataFrameで、ある列のデータに対して同じ処理を適用したい、というケースがあります。

いくつかの実現方法があります。

直接
apply
テストデータ

こんなデータを用意しま ...

開発

はじめに

暗号化の概要を把握してみる試みです。
暗号化ナニソレ?という人が大枠を掴めて、暗号化処理の実装を書いてみることができることが本記事のゴールです。
今日は前編。

暗号化とは?

「データを加工して読めなく ...

プロダクト開発

はじめに

業務でスクラムによるアジャイル開発を主導することになり、きちんと勉強するべく本を読んでます。学んだことを整理するために読書メモとしてまとめておきます。

まずは「SCRUM BOOT CAMP THE BOOK」です ...

ネットワーク

はじめに

エンジニアとして仕事をしていますが、ネットワークについてはきちんと理解できていないと思い、ネットワークを基本から勉強し直しています。
学んだことをまとめていきます。

ネットワークとは?

ネットワークとは、コン ...

開発

はじめに

pandas、いいですね。

基本的な集計はこれですべて事足りるのではないかと思うほどです。
SpreadsheetやMySQLになまじ慣れてしまっており、本腰入れて勉強していなかった過去を反省しています。 ...

開発

はじめに

泥臭い系の話です。
結論、正規表現とsedを使えると効率化がめちゃくちゃ捗ります。

具体的な事例

例えばこんなケース:

特定の顧客の売上金額をDBから集計したい。
DBにはsalesテーブルがあり ...

開発

はじめに

2020年になりました。昨年どんな本を読んだか振り返ろうとしたときに、リストを作るのが面倒だったので書いてみました。

概要

流れは以下です。

Amazonから履歴を取得し、HTMLファイルとして保存
Be ...

開発

はじめに

文字列の類似度を定量化する手法を調べたのでPythonでの実装方法と簡単な結果をメモします。
3つのアプローチを紹介します。

ゲシュタルトパターンマッチング概要

文字列同士の連続する共通部分を抜き出し、抜き出 ...

開発

mergeで2つのDataFrameを結合できる

複数のDataFrameを、共通の列でまとめることができます。
SQLのJOINに近い使い方ができます。

基本的な使い方pd.merge(, , on='{カラム名}',h ...

開発

はじめに

pandas.groupby()を実行すると以下のエラーメッセージが出ました。

ValueError: Grouper for '' not 1-dimensional

エラーメッセージを読んでデータの中身を見ると、 ...